Программирование и комп-ры

Процессоры


  МИНИСТЕРСТВО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ ХАНТЫ-МАНСИЙСКИЙ АВТОНОМНЫЙ
                                    ОКРУГ
                       ДЕПАРТАМЕНТ ОБРАЗОВАНИЯ И НАУКИ
                  МУНИЦИПАЛЬНОЕ ПРОФЕССИОНАЛЬНОЕ УЧИЛИЩЕ №1



                                                                  УТВЕРЖДЕНО

                                                       Зам. директора по УПР
                                                                     _______
                                                       «____»________2002 г.



                         ПИСЬМЕННАЯ ЭКЗАМЕНАЦИОННАЯ

                                   РАБОТА


Учащегося:

Специальность:____________________________

Тема:_____________________________________
__________________________________________


Преподаватель:

Консультант:

                                      Дата выдачи задания: «___»_____2002 г.
                                               Срок сдачи: «___»_____2002 г.
                                        Подпись учащегося: «___»_____2002 г.



                              г. Покачи 2002 г.

                                 Содержание

   1. Введение в персональный компьютер.
   2. Отличия процессоров.
   2.1. Отличия пpоцессоpов SX, DX, SX2, DX2 и DX4.
   2.2. Обозначение "SL-Enhanced" y пpоцессоpов Intel 486.
   2.5. Идентификация чипов Intel и AMD.
   2.5.2. Версия процессора.
   2.5.4. Перемаркированные процессоры.
   3. Процессоры фирмы Intel.
   3.1. Современная микропроцессорная технология фирмы Intel.
   3.2. Первые процессоры фирмы Intel.
   3.3. Процессор 8086/88.
   3.4. Процессор 80186/88.
   3.5. Процессор 80286.
   3.6. Процессор 80386.
   3.7. Процессор 80486.
      3.7.1.Процессор i486SX.
      3.8. Intel OverDrive процессор.
   3.9. Процессор Pentium.
   3.10. Процессор Pentium Pro.
   3.10.1. Общее описание процессора.
   3.10.2. Два кристалла в одном корпусе.
   3.10.3. Значения тестов для некоторых чипов фирмы Intel.
   4. Процессоры конкурентов Intel.
   4.1. Первые процессоры конкурентов Intel.
   4.2. Процессоры фирмы AMD.
   4.2.1. Судебное разбирательство с Intel.
   4.2.2. Процессоры семейства AMD5k86.
   4.2.2.1 Экскурсия по внутренней архитектуре.
   4.2.2.2. Пример маркировки микропроцессора AMD5k86-P75.
   4.2.2.5. AMD планирует выпустить K5.
   4.3. Процессоры NexGen.
   4.4. Процессоры Cyrix.
   4.5. Процессоры Sun Microsystems.
   4.6. Процессоры Digital Equipment.
   4.7. Процессоры Mips.
   4.8. Процессоры Hewlett-Packard.
   4.9. Процессоры Motorola.
   5. Лабораторные испытания и тестирование микропроцессоров.
   5.1. Лабораторные испытания процессоров i386DX.
   5.2. Результаты тестирования микропроцессоров  с  помощью  пакета  Speed
        Test.
   6. Сравнительный анализ. ………………..
     7.  Pentium II. …………………………….……………………….      7.1 Pentium II.
   ……………………………………………………..……. 7.2 Deschutes. …………………………………………………………... 7.3
   Мобильный Pentium II. ……………………………………………. 7.4 Celeron.
   ……………………………………………………………... 7.5  Pentium “Xeon”. ……………………………………………………



                    1. Введение в персональный компьютер.

       Персональный компьютер - это  такой  компьютер,  который  может  себе
позволить купить отдельный человек.
       Наиболее "весомой" частью любого компьютера является  системный  блок
(иногда  его  называют  компьютером,  что  является  недопустимой  ошибкой).
Внутри него расположены блок питания, плата с центральным процессором  (ЦП),
видеоадаптер, жесткий диск, дисководы  гибких  дисков  и  другие  устройства
ввода /  вывода  информации.  Зачастую  видеоадаптер  и  контроллеры  ввода/
вывода размещены прямо на плате ЦП.  В  системном  блоке  могут  размещаться
средства мультимедиа: звуковая плата и устройство чтения  оптических  дисков
- CD-ROM. Кроме того, в понятие "компьютер"  входит  клавиатура  и  монитор.
Манипулятор мышь является необязательной, но весьма важной  деталью.  Теперь
коротко о  выборе  основных  компонентов  ПК.  Процессор  является  основным
компонентом любого ПК. В настоящее время наиболее распространены  процессоры
фирмы Intel, хотя ЦП других фирм (AMD, Cyrix, NexGen и  др.)  составляют  им
достойную  конкуренцию.  Имеется  также  материнская  (MotherBoard)   плата.
Основной  характеристикой  материнских   плат   является   их   архитектура.
Основными шинами до недавнего времени  считались  ISA  (Industrial  Standard
Architecture)  и  EISA  (Extended  ISA),  и  имеющие  разрядность  10  и  32
соответственно.  Для  обеспечения  нормальной  работы   видеоадаптеров   был
разработан  стандарт   VESA   (Video   Electronic   Standart   Association),
рассчитанный на применение  процессора  серии  486,  работающей  на  частоте
процессора и являющейся "приставкой" к  шине  ISA  или  EISA.  С  появлением
процессора Pentium была разработана самостоятельная  шина  PCI,  которая  на
сегодняшний день является наиболее быстрой  и  перспективной.  Обычно  в  ПК
присутствует дисковод для гибких дисков. Существует два стандарта : 5.25"  и
3.5". На сегодняшний день большинство компьютеров поставляется с  дисководом
3.5". Жeсткий диск (винчестер), начав свое шествие с объема в 5  МБ,  достиг
небывалых высот. На сегодняшний день не удивят диски объемом  2  или  4  ГБ.
Для большинства приложений вполне достаточно объема 420  -  700  МБ,  однако
если вам приходится работать с полноцветными графическими изображениями  или
версткой, то придется подумать о диске в 1.5-  2  ГБ  или  даже  паре  таких
дисков.  Следует  придать  значение  не  только  емкости  диска,  но  и  его
временным характеристикам.  В  качестве  оптимальных  можно  порекомендовать
винчестеры фирмы  Western  Digital,  Seagate  или  Corner.  Для  оперативной
памяти (RAM, ОЗУ) закон простой: чем больше, тем лучше.  В  настоящее  время
трудно найти конфигурацию с  объемом  памяти  менее  4  МБ.  Для  нормальной
работы большинства программных продуктов желательно иметь хотя бы  заметить,
что при увеличении ОЗУ более  чем  32  МБ  быстродействие  ПК  увеличивается
менее  значительно,   и   такая   конфигурация   необходима   художникам   и
мультипликаторам. Hеотъемлемой частью ПК является клавиатура. Стандартной  в
России  является  101  -  клавишная  клавиатуры  с  английскими  и  русскими
символами. Мышь. Необходима для работы с графическими  пакетами,  чертежами,
при разработке  схем  и  при  работе  под  Windows.  Следует  отметить,  что
некоторое игровое и программное обеспечение требует наличие  мыши.  Основной
ха мыши является  разрешающая  способность,  измеряемая  в  точках  на  дюйм
(dpi). Нормальной считается мышь,  обеспечивающая  разрешение  300-400  dpi.
Неплохо иметь  также  специальный  коврик  под  мышь,  что  обеспечивает  ее
сохранность и долговечность.  Выбору  монитора  ПК  следует  уделить  особое
внимание, поскольку от качества монитора зависит сохранность  вашего  зрения
и  общую  утомляемость  при  работе.  Мониторы  имеют   стандартный   размер
диагонали в 14,15,17,19,20 и 21 дюйм. Необходимый размер диагонали  монитора
выбирается исходя их разрешения, при котором вы собираетесь  работать.  Так,
для большинства приложений вполне  достаточно  иметь  14  дюймовый  монитор,
который обеспечивает работу при разрешениях до 800 на 600  точек.  ПК  может
иметь  звуковую  карту.  С  одной  стороны,  звуковая  карта   не   является
необходимым  элементом  компьютера,  но,   с   другой   стороны,   позволяет
превратить его в мощное подспорье при обучении и написании музыки,  изучении
языков. Да и какой интерес  бить  врагов  на  экране,  если  не  слышишь  их
предсмертные крики. Простейшей  картой  является  Adlib,  который  позволяет
воспроизводить только музыку  без  оцифрованной  речи.  И  CD-ROM,  с  одной
стороны, также  не  являются  необходимой  для  функционирования  компьютера
частью, но становится все более и более популярными  в  связи  с  тенденцией
поставлять профессиональное, обучающее и игровое программное обеспечение  на
CD-дисках.



                           2. Отличия процессоров.

              2.1. Отличия процессоров SX, DX, SX2, DX2 и DX4.

       SX и DX обозначает "облегченную" и полную версию  одного  и  того  же
процессора. Для 386 вариант SX был сделан с  16-pазpядным  интерфейсом,  что
позволяло экономить на обвязке и устанавливать память по два SIMM, а  не  по
четыре, как для DX. Пpи работе с 16-pазpядными программами  386SX  почти  не
отстает от 386DX на той же частоте, однако  на  32-pазpядных  программах  он
работает ощутимо медленнее из-за разделения каждого 32-pазpядного запроса  к
памяти на два 16-pазpядных. Hа  самом  же  деле  большинство  компьютеров  с
386DX работают быстрее компьютеров с SX даже на  16-pазpядных  программах  –
благодаря  тому, что на платах с  386DX  чаще  всего  установлен  аппаратный
кэш, которого нет на большинстве плат с SX. внутренняя архитектура  386SX  -
полностью 32-pазpядная, и программно обнаружить разницу между SX  и  DX  без
запроса кода процессора или измерения скорости  работы  магистpали  в  общем
случае невозможно.
       Для 486 SX обозначает вариант без  встроенного  сопроцессора.  Ранние
модели  представляли  собой  просто   отбраковку   от   DX   с   неисправным
сопроцессором – сопроцессор в них был заблокирован, и для  установки  такого
процессора  вместо  DX  требовалось  перенастроить  системную  плату.  Более
поздние версии выпускались самостоятельно, и  могут  устанавливаться  вместо
DX  без  изменения  настройки  платы.  Кроме   отсутствия   сопроцессора   и
идентификационных  кодов,  модели  SX   также   ничем   не   отличаются   от
соответствующих моделей DX, и программное различение их в общем случае  тоже
невозможно.
       SX2, DX2 и DX4 – варианты соответствующих  процессоров  с  внутренним
удвоением или утроением частоты. Hапpимеp, аппаратная  настройка  платы  для
DX2-66 делается, как для DX33, и на вход подается частота 33 МГц,  однако  в
программной настройке может потребоваться увеличение задержек при  обращении
к  памяти  для  компенсации  возросшей  скорости  работы   процессора.   Все
внутренние операции в процессорах выполняются соответственно  в  два  и  три
раза быстрее,  однако  обмен  по  внешней  магистpали  определяется  внешней
тактовой частотой. За счет этого DX4-100 работает втрое быстрее DX33  только
на тех участках программ, которые целиком помещаются в его  внутренний  кэш,
на больших фрагментах это отношение может  упасть  до  двух  с  половиной  и
меньше.
       Hекотоpые серии процессоров AMD (в частности – 25253)  выпускались  с
единым кристаллом  DX4,  который  мог  переключаться  в  режим  удвоения  по
низкому уровню на выводе B-13. маркировка как DX2  или  DX4  проводилась  по
результатам тестов; соответственно, процессор, маркированный  как  DX4,  мог
работать как DX2 и наоборот. Процессоры Intel DX4 – 100 могут  переключаться
в режим удвоения по низкому уровню на выводе R – 17.
       процессор AMD 5x86 стандартно работает с утроением внешней частоты, а
низкий уровень на выводе R – 17 переключает его в режим учетвеpения.


          2.2. Обозначение "SL – Enhanced" у процессоров Intel 486.

       Hаличие SMM (System Management Mode  -  режим  управления  системой),
используемого главным образом для перевода процессора в  экономичный  режим.
Еще обозначается как "S – Series", с добавлением  к  обозначению  процессора
суффикса "–S". В SL – Enhanced  процессорах  имеется  также  команда  CPUID,
которая возвращает идентификатор процессора.


         2.3. Отличия процессоров UMC 486 U5 от Intel, AMD и других.

       Прежде всего  -  оптимизированным  микрокодом,  за  счет  чего  часто
используемые команды выполняются за меньшее число тактов, чем в  процессорах
Intel, AMD, Cyrix и других. Пpоцессоpы U5  не  имеют  внутреннего  умножения
частоты,  а  результаты  в  65  МГц  и   подобные,   получаемые   некоторыми
программами,  получаются  потому,  что  для  определения  частоты  программе
необходимо правильно опознать процессор - точнее, число тактов,  за  которое
он выполнит  тестовую  последовательность,  а  большинство  распространенных
программ не умеют  правильно  опознавать  U5.  По  этой  же  причине  на  U5
зависает игра  Heretic,  ошибочно  найдя  в  нем  сопроцессор  -  чтобы  это
исключить, нужно в командной строке Heretic указать ключ "- debug".

                           2.4. Чипы RISC и CISC.
RISC - это аббревиатура от Reduced Instruction  Set  Computer  (компьютер  с
сокращенным набором команд), а CISC -  аббревиатура  от  Comlex  Instruction
Set Computer (компьютер  с  полным  набором  команд).  Существенная  разница
между  ними  состоит  в  следующем:  чипы  RISC  понимают   лишь   некоторые
инструкции, но каждую из них они могут  выполнить  очень  быстро.  Программы
для RISC-машин достаточно сложны, но выполняются они  быстрее  тех,  которые
совместимы с CISC-машинами. Hо, может быть,  это  и  не  так?  (Исследования
производительности еще не завершены.)

       Все  чипы  Intel  80x86  (как  и   чипы     Motorola   680x0
(68010,68020,..,68040),  используемые  в  компьютерах  Macintosh   и   NeXT)
являются  яркими  представителями  CISC-чипов.  Hекоторые  рабочие  станции,
начиная с IBM, используют чипы RISC.


                    2.5. Идентификация чипов Intel и AMD.

                            2.5.1. Кодексы даты.

       Просите у продавца кодексы даты прежде, чем Вы купите процессор.  Все
ЦПУ имеют дату выпуска, которая проставляется  на  корпусе.  Удостоверьтесь,
что Вы приобретаете новый процессор, а не прошлогодний.

 Например A80486DX33 ( by Intel )
         V74400223
  V   - первый символ, код завода (plant code);
  7  -  второй  символ,  это  последняя  цифра  года   выпуска   процессора,
       рассматриваемый процессор выпущен в 1987 году;
  44 - следующие две цифры, 44-я рабочая неделя в этом году  (1987);  002  -
  следующие 3 цифры, номер партии (sequence number);
  3  -  код замены (change code).

 Hапример E6 9433 DPD (on AMD CPUs)
  E6   - версия реализации (version release);
  9433 - выпущен на 33 рабочей неделе 1994 года;
  DPD  - шифр серии (wafer number);



                          2.5.2. Версия процессора.

       Просите данные  о  версии  процессора.  Сравните  версию  процессора,
который Вам предлагают с процессорами Intel 800-468-3548  или  AMD  800-222-
9323, так как более ранние  версии  процессоров  имеют  ошибки  и  различные
дефекты.

                            2.5.3. Demo-образцы.

       Никогда не платите полную цену за demo-образцы. AMD  и  Intel  делают
технические образцы для каждой версии процессора, прежде,  чем  будет  начат
серийный выпуск процессора. Такой ЦПУ может иметь ошибки(дефекты),  так  как
обычно  создан  для  испытания.  Совершенно  не  предполагается,  что  такой
процессор продадут конечному пользователю.
       Hапример:
  Нормальная версия (normal version): i486DX-33:
  Разработка образцов (engineering samples): i486DX-33 E

                    2.5.4. Перемаркированные процессоры.

       Перемаркированные процессоры (remaked CPUs) - это процессоры, которые
разгоняют сильнее, чем оригинальные для более высокой цены  и  прибыли.  Эти
действия считаются незаконными. Использование такого ЦПУ всегда  рискованно.
Разгонка процессора иногда бывает успешной, например, с 33MHz до 40MHz,  или
с 25MHz до  33MHz,  но  не  всегда.  Использование  разогнанного  процессора
приводит к перегреванию чипа и его нестабильной  работе,  что  часто  служит
причиной всевозможных ошибок, сбоев и зависаний  системы.  Перемаркированный
и разогнанный ЦПУ  имеет  гораздо  меньший  срок  службы,  чем  оригинальный
процессор, благодаря перегреванию чипа.



                         3. Процессоры фирмы Intel.

         3.1. Современная микропроцессорная технология фирмы Intel.

       Достижения фирмы Intel  в  искусстве  проектирования  и  производства
полупроводников делают возможным производить мощные  микропроцессоры  в  все
более  малых  корпусах.  Разработчики  микропроцессоров  в  настоящее  время
работают  с  комплиментарным  технологическим  процессом   метал   –   оксид
полупроводник (CMOS) с разрешением менее, чем микрон.
       Использование субмикронной технологии позволяет  разработчикам  фирмы
Intel располагать  больше  транзисторов  на  каждой  подложке.  Это  сделало
возможным увеличение количества транзисторов для семейства X86 от  29,000  в
8086 процессоре до 1,2 миллионов в  процессоре  Intel486  DX2,  с  наивысшим
достижением в  Pentium  процессоре.  Выполненный  по  0.8  микронной  BiCMOS
технологии,  он  содержит  3.1  миллиона  транзисторов.  Технология   BiCMOS
объединяет преимущества двух технологий:  биполярной  (скорость)  и  CMOS  (
малое энергопотребление  ).  С  помощью  более,  чем  в  два  раза  большего
количества  транзисторов  Pentium  процессора  по  сравнению   с   Intel486,
разработчики  поместили  на  подложке  компоненты,  ранее   располагавшимися
снаружи процессора. Наличие компонентов внутри уменьшает время доступа,  что
существенно увеличивает производительность. 0.8 микронная  технология  фирмы
Intel использует трехслойный  металл  и  имеет  уровень,  более  высокий  по
сравнению с оригинальной 1.0  микронной  технологией  двухслойного  металла,
используемой в процессоре Intel486.

                     3.2. Первые процессоры фирмы Intel.

       За 20-летнюю  историю  развития  микропроцессорной  техники,  ведущие
позиции  в  этой  области  занимает  американская  фирма   Intel   (INTegral
ELectronics). До того как фирма Intel начала выпускать микрокомпьютеры,  она
разрабатывала и производила другие виды интегральных микросхем.  Главной  ее
продукцией были микросхемы для калькуляторов. В 1971 г.  она  разработала  и
выпустила первый в мире 4-битный микропроцессор  4004.  Фирма  первоначально
продавала его в качестве  встроенного  контроллера  (что-то  вроде  средства
управления  уличным  светофором   или   микроволновой   печью).   4004   был
четырехбитовым, т.е. он мог хранить, обрабатывать и записывать в память  или
считывать из нее четырехбитовые числа. После чипа  4004  появился  4040,  но
4040 поддерживал внешние прерывания.  Оба  чипа  имели  фиксированное  число
внутренних индексных регистров.  Это  означало,  что  выполняемые  программы
были ограничены числом вложений подпрограмм до 7.
       В 1972 г., т.е. спустя год  после  появления  4004,  Intel  выпустила
очередной  процессор  8008,  но   подлинный   успех   ей   принес   8-битный
микропроцессор 8080, который был объявлен  в  1973  г.  Этот  микропроцессор
получил очень широкое распространение во всем мире. Сейчас  в  нашей  стране
его  аналог  -  микропроцессор  KP580ИК80  применяется  во  многих   бытовых
персональных компьютерах и разнообразных контроллерах. С  чипом  8080  также
связано  появление  стека  внешней  памяти,   что   позволило   использовать
программы любой вложенности.
       Процессор 8080 был основной  частью  первого  небольшого  компьютера,
который  получил  широкое  распространение  в  деловом  мире.   Операционная
система для него была создана фирмой Digital Research и  называлась  Control
Program for Microcomputers (CP/M).



                           3.3. Процессор 8086/88.

       В 1979 г. фирма Intel первой выпустила 16-битный микропроцессор 8086,
возможности которого были близки к возможностям процессоров  миникомпьютеров
70-х годов. Микропроцессор 8086 оказался  "прародителем"  целого  семейства,
которое называют семейством 80x86 или х86.
       Hесколько   позже   появился   микропроцессор   8088,    архитектурно
повторяющий микропроцессор 8086 и имеющий 16-битный внутренние регистры,  но
его  внешняя  шина   данных   составляет   8   бит.   Широкой   популярности
микропроцессора способствовало его  применение  фирмой  IBM  в  персональных
компьютерах PC и PC/XT.


                          3.4. Процессор 80186/88.

       В 1981 г. появились микропроцессоры  80186/80188,  которые  сохраняли
базовую архитектуру микропроцессоров 8086/8088, но  содержали  на  кристалле
контроллер  прямого  доступа   к   памяти,   счетчик/таймер   и   контроллер
прерываний. Кроме того, была  несколько  расширена  система  команд.  Однако
широкого распространения эти микропроцессоры (как и персональные  компьютеры
PCjr на их основе), не получили.



                            3.5. Процессор 80286.

       Следующим крупным шагом в разработке новых идей  стал  микропроцессор
80286, появившийся в 1982 году. При  разработке  были  учтены  достижения  в
архитектуре микрокомпьютеров и больших компьютеров.  Процессор  80286  может
работать  в  двух  режимах:  в  режиме   реального   адреса   он   эмулирует
микропроцессор 8086, а в защищенном режиме  виртуального  адреса  (Protected
Virtual Adress Mode) или P-режиме  предоставляет  программисту  много  новых
возможностей и  средств.  Среди  них  можно  отметить  расширенное  адресное
пространство  памяти  16   Мбайт,   появление   дескрипторов   сегментов   и
дескрипторных  таблиц,  наличие  защиты  по  четырем   уровням   привилегий,
поддержку  организации  виртуальной  памяти  и  мультизадачности.  Процессор
80286 применяется в ПК PC/AT и младших моделях PS/2.


                            3.6. Процессор 80386.

       При разработке 32-битного процессора 80386 потребовалось  решить  две
основные задачи - совместимость и производительность.  Первая  из  них  была
решена с помощью эмуляции микропроцессора  8086  -  режим  реального  адреса
(Real Adress Mode) или R-режим.
       В Р – режиме процессор  80386  может  выполнять  16-битные  программы
(код) процессора 80286 без каких-либо дополнительных модификаций.  Вместе  с
тем, в этом же режиме  он  может  выполнять  свои  "естественные"  32-битные
программы, что обеспечивает повышение производительности системы.  Именно  в
этом режиме реализуются все новые возможности и средства  процессора  80386,
среди которых можно отметить масштабированную  индексную  адресацию  памяти,
ортогональное использование  регистров  общего  назначения,  новые  команды,
средства отладки. Адресное пространство памяти в этом  режиме  составляет  4
Гбайт.
       Микропроцессор 80386 дает разработчику систем большое число  новых  и
эффективных возможностей, включая  производительность  от  3  до  4  миллион
операций в секунду, полную 32-битную  архитектуру,  4  гигабитное  (2  байт)
физическое  адресное  пространство  и  внутреннее  обеспечение   работы   со
страничной виртуальной памятью.
       Несмотря на введение в него  последних  достижений  микропроцессорной
техники, 80386 сохраняет совместимость  по  объектному  коду  с  программным
обеспечением, в большом  количестве  написанным  для  его  предшественников,
8086  и  80286.  Особый  интерес  представляет  такое  свойство  80386,  как
виртуальная машина,  которое  позволяет  80386  переключаться  в  выполнении
программ, управляемых различными операционными системами, например,  UNIX  и
MS-DOS.  Это   свойство   позволяет   производителям   оригинальных   систем
непосредственно вводить прикладное  программное  обеспечение  для  16-битных
машин в системе на базе 32-битных микропроцессоров. Операционная система  P-
режима может создавать задачу, которая может работать в режиме  виртуального
процессора 8086 (Virtual  8086  Mode)  или  V-режим.  Прикладная  программа,
которая выполняется в этом режиме, полагает, что она работает на  процессоре
8086.
       32-битная  архитектура  80386   обеспечивает   программные   ресурсы,
необходимые для поддержки "больших " систем,  характеризуемых  операциями  с
большими числами, большими структурами  данных,  большими  программами  (или
большим числом программ)  и  т.п.  Физическое  адресное  пространство  80386
состоит из 2 байт или 4 Гбайт; его логическое адресное пространство  состоит
из 2 байт или 64 терабайт (Тбайт). Восемь 32-битных  общих  регистров  80386
могут  быть  взаимозаменяемо  использованы  как  операнды   команд   и   как
переменные различных способов адресации. Типы данных включают в себя 8-, 16-
 или 32-битные целые и порядковые, упакованные и  неупакованные  десятичные,
указатели, строки бит, байтов, слов и  двойных  слов.  Микропроцессор  80386
имеет полную систему команд для операций над этими типами  данных,  а  также
для управления выполнением программ. Способы  адресации  80386  обеспечивают
эффективный  доступ  к  элементам  стандартных  структур  данных:  массивов,
записей, массивов записей и записей, содержащих массивы.
       Микропроцессор 80386 реализован с помощью технологии фирмы  Intel  CH
MOSIII  -  технологического  процесса,  объединяющего  в  себе   возможности
высокого быстродействия технологии  HMOS  с  малым  потреблением  технологии
кмоп. Использование геометрии 1,5 мкм и слоев металлизации дает 80386  более
275000 транзисторов на кристалле. Сейчас  выпускаются  оба  варианта  80386,
работающих на частоте I2 и I6 МГц без  состояний  ожидания,  причем  вариант
80386 на 16  МГц  обеспечивает  скорость  работы  3-4  миллиона  операций  в
секунду.
       Микропроцессор 80386 разделен внутри на  6  автономно  и  параллельно
работающих блоков с соответствующей  синхронизацией.  Все  внутренние  шины,
соединяющие эти блоки, имеют разрядность  32  бит.  Конвейерная  организация
функциональных блоков  в  80386  допускает  временное  наложение  выполнения
различных  стадий  команды  и  позволяет  одновременно  выполнять  несколько
операций. Кроме конвейерной обработки всех команд, в 80386  выполнение  ряда
важных  операций  осуществляется  специальными  аппаратными   узлами.   Блок
умножения/деления 80386 может выполнять 32-битное  умножение  за  9-41  такт
синхронизации, в зависимости от числа значащих цифр; он может разделить  32-
битные операнды за 38 тактов (в случае чисел без знаков) или за 43 такта  (в
случае чисел со знаками). Регистр группового  сдвига  80386  может  за  один
такт сдвигать от 1 до 64 бит. Обращение к  более  медленной  памяти  (или  к
устройствам ввода/вывода) может производиться с использованием  конвейерного
формирования адреса для увеличения времени установки данных после адреса  до
3  тактов  при  сохранении  двухтактных  циклов  в  процессоре.   Вследствие
внутреннего конвейерного формирования адреса при исполнении команды,  80386,
как правило, вычисляет адрес и определяет следующий  магистральный  цикл  во
время текущего магистрального цикла. Узел конвейерного  формирования  адреса
передает эту опережающую  информацию  в  подсистему  памяти,  позволяя,  тем
самым, одному банку памяти дешифрировать следующий магистральный цикл, в  то
время как другой банк реагирует на текущий магистральный цикл.


                            3.7. Процессор 80486.

       В 1989 г. Intel представила первого  представителя  семейства  80х86,
содержащего более миллиона (а точнее, 1,2 миллиона)   транзисторов  в  чипе.
Этот чип во многом сходен  с  80386.  Он  на  100%  программно  совместим  с
микропроцессорами 386(ТМ) DX & SX. Один  миллион  транзисторов  объединенной
кэш-памяти (сверхбыстрой  оперативной  памяти),  вместе  с  аппаратурой  для
выполнения операций с  плавающей  запятой  и  управлением  памяти  на  одной
микросхеме,  тем  не  менее   поддерживают   программную   совместимость   с
предыдущими   членами   семейства   процессоров   архитектуры   86.    Часто
используемые операции выполняются за один цикл, что  сравнимо  со  скоростью
выполнения RISC-команд. Восьмикилобайтный унифицированный  кэш  для  кода  и
данных, соединенный с шиной пакетного обмена  данными  со  скоростью  80/106
Мбайт/сек при частоте 25/33  Мгерц  гарантируют  высокую  производительность
системы даже  с  недорогими  дисками  (DRAM).  Новые  возможности  расширяют
многозадачность  систем.  Новые  операции  увеличивают  скорость  работы   с
семафорами   в    памяти.    Оборудование    на    микросхеме    гарантирует
непротиворечивость  кэш-памяти  и  поддерживает  средства   для   реализации
многоуровневого  кэширования.  Встроенная  система  тестирования   проверяет
микросхемную логику, кэш-память и микросхемное  постраничное  преобразование
адресов памяти.  Возможности  отладки  включают  в  себя  установку  ловушек
контрольных точек в выполненяемом коде и при  доступе  к  данным.  Процессор
i486 имеет встроенный  в  микросхему  внутренний  кэш  для  хранения  8Кбайт
команд  и  данных.  Кэш  увеличивает  быстродействие  системы,  отвечая   на
внутренние  запросы  чтения  быстрее,  чем  при  выполнении   цикла   чтения
оперативной памяти по  шине.  Это  средство  уменьшает  также  использование
процессором внешней шины. Внутренний кэш прозрачен для работающих  программ.
Процессор i486 может использовать внешний кэш второго уровня вне  микросхемы
процессора.  Обычно  внешний  кэш  позволяет  увеличить   быстродействие   и
уменьшить полосу пропускания шины, требуемую процессором i486.

                           3.7.1.Процессор i486SX
Появление нового микропроцессора i486SX фирмы Intel   вполне  можно  считать
одним из важнейших событий 1991 года. Уже
предварительные  испытания  показали,  что  компьютеры  на  базе  i486SX   с
тактовой частотой   20 МГц работают быстрее (примерно на  40%)  компьютеров,
основанных на i80386DX с тактовой частотой 33  МГц.  Микропроцессор  i486SX,
подобно оригинальному i486DX, содержит на  кристалле  и  кэш-память,  а  вот
математический  сопроцессор  у  него  заблокирован.  Значительная   экономия
(благодаря исключению затрат на тестирование сопроцессора)  позволила  фирме
Intel существенно снизить цены на новый микропроцессор.  Надо  сказать,  что
если  микропроцессор  i486DX  был  ориентирован  на  применение  в   сетевых
серверах  и рабочих  станциях,  то  i486SX  послужил  отправной  точкой  для
создания  мощных  настольных  компьютеров.  Вообще   говоря,   в   семействе
микропроцессоров i486 предусматривается  несколько  новых  возможностей  для
построения мультипроцессорных систем: соответствующие  команды  поддерживают
механизм   семафоров   памяти,   аппаратно   -    реализованное    выявление
недостоверности  строки  кэш-памяти   обеспечивает   согласованность   между
несколькими модулями кэш-памяти и т.д. Для микропроцессоров  семейства  i486
допускается адресация физической памяти размером 64 Тбайт

                       3.8. Intel OverDrive процессор.

       Возможность постоянного совершенствования. Пользователи  персональных
компьютеров  все  чаще  сталкиваются  с  этим  по  мере   все   возрастающих
требований  к  микропроцессорам  со  стороны  аппаратного   и   программного
обеспечения. Фирма  Intel  уверена:  лучшая  стратегия  совершенствования  -
первоначально заложенная в систему  возможность  модернизации,  модернизации
согласно вашим нуждам. Впервые  в  мире  такая  возможность  предоставляется
нашим  потребителям.  Фирма  Intel  приступила  к  выпуску  Intel  OverDrive
процессора,  открывающего  новую  категорию  мощных   сопроцессоров.   После
простой установки  этого  сопроцессора  на  плату  резко  вырастет  скорость
работы  всей  системы  и  прикладных  программ  в  MS-DOS,  Windows,   OS/2,
Windows'95 и UNIX.
       С помощью этой одной-единственной  микросхемы  Вы  сразу  же  сможете
воспользоваться преимуществами новой стратегии  фирмы  Intel,  заложенной  в
нашей продукции. Когда настанет неотвратимый момент, когда  Вам  потребуется
производительность большая, чем у Вашего компьютера, то все, что  Вам  будет
нужно - это вставить OverDrive процессор в Вашу  систему  -  и  пользоваться
преимуществами, которые даст Вам новая  микропроцессорная  технология  фирмы
Intel. Более чем просто модернизация, OverDrive процессор  -  это  стратегия
защиты Ваших настоящих и будущих вкладов в персональные компьютеры.
       Intel OverDrive процессор гарантирует  Вам  отвечающую  стандартам  и
экономичную   модернизацию.   Всего   лишь    одна    микросхема    увеличит
вычислительную мощь Вашего  компьютера  до  требований  самого  современного
программного обеспечения и даже тех программ, которые еще не написаны, в MS-
DOS, в Windows, в PS/2, в UNIX, от AutoCAD - до WordPerfect.
       Итак,  наш  первый  микропроцессор  в  серии  Single   Chip   Upgrade
(Качественное улучшение - одной микросхемой) - это OverDrive  процессор  для
систем на основе Intel i486SX. Установленный  в  OverDrive  –  разъем,  этот
процессор  позволяет  системе  i486SX   использовать   новейшую   технологию
"удвоения скорости", используемую  в  процессоре  i486DX2,  и  дающую  общее
увеличение производительности до 70%. OverDrive процессор для систем  i486SX
содержит модуль операций над целыми числами, модуль операций над  числами  с
плавающей точкой,  модуль  управления  памятью  и  8К  кэш-памяти  на  одном
кристалле, работающем на частоте, в два раза  превышающей  тактовую  частоту
системной шины. Это  уникальное  свойство  позволяет  Вам  удвоить  тактовую
частоту  Вашей  системы,  не  тратясь  на   покупку   и   установку   других
дополнительных   компонентов.   OverDrive   процессор   удвоит,    например,
внутреннюю частоту МП i486SX 25 МГц до 50 МГц.
       Хотя Intel OverDrive - это совершенно новая  технология  качественной
модернизации, в нем  узнаются  и  фамильные  черты  Intel.  Изготовленный  и
испытанный  в  соответствии  с   жесткими   стандартами   Intel,   OverDrive
отличается зарекомендовавшими себя свойствами продукции Intel:  качеством  и
надежностью. OverDrive обеспечен постоянной гарантией и  привычным  сервисом
и поддержкой во всем мире. OverDrive полностью совместим более чем  с  50000
прикладных программ. OverDrive процессор  для  i486SX  -  только  первый  из
наших  новых  процессоров.  Во  втором  полугодии  1992  года  мы   выпустим
OverDrive процессор для систем i486DX2, самих по себе  представляющих  новое
поколение технологии МП. Мощный и доступный,  OverDrive  процессор  проложит
для Вас непрерывный путь  к  качественно  новым  уровням  производительности
персональных компьютеров.
       Hекоторые   результаты   лабораторных   испытаний   Intel   OverDrive
процессора:
       1. Работа с Microsoft Word for Windows 6.1 в среде Windows
3.0, популярным текстовым процессором.
       Тест исполнялся  на  системе  с  i486SX  20  МГц  с  файлом  330  КВ.
WordPerfect, преобразованном в  формат  Windows  Word,  было  выполнено  648
контекстных поисков и замен, проверка  правописания  во  всем  файле,  затем
файл был сохранен.
       Время исполнения:
           i486SX без OverDrive =107 с
           ---------------------------- ВЫИГРЫШ = 57%
           i486SX с OverDrive = 68 с
       2.  Работа  с  Lotus  1-2-3   Release   3.0,   электронной   таблице,
приближающейся по возможностям к интегрированной среде,  обладающей  широким
выбором аналитических, экономических и статистических функций.
       Тест исполнялся на i486SX 20 МГц с таблицей  объемом  433К  на  10000
ячеек, которая была загружена  и  пересчитана.  Кроме  того,  был  обработан
большой блок текстовых данных.
       Время исполнения:
           i486SX без OverDrive=250 с
           ---------------------------- ВЫИГРЫШ = 481%
           i486SX с OverDrive = 43 с

           i486SX с i487SX =  72 с
           ---------------------------- ВЫИГРЫШ = 67%
           i486SX c OverDrive =   43 c

       3. Работа с AutoCAD, популярной системой САПР.
       Тест исполнялся на i486SX 20 МГц с трехмерным архитектурным чертежом,
над   которым   выполнялись   операции   перечеркивания,    панорамирования,
масштабирования, удаления скрытых  линий  и  повторной  генерации  файла  во
внешнем формате.
       Время исполнения:
           i486SX с i487SX =  162 с
           ---------------------------- ВЫИГРЫШ = 45%
           i486SX c OverDrive =   112 c
       А  вот  что  говорят   об   OverDrive   процессоре   те,   кому   уже
посчастливилось поработать с ним:
       Брент Грэхэм: (специалист по автоматизации офисов, US Bank, Портленд)
"С теми возможностями модернизации, которые предоставляет Intel  486,  я  не
вижу причин не использовать OverDrive процессор. Что касается его  установки
в систему, то с этим справится даже мой 10-летний сынишка."
       Билл Лодж:      (руководитель    проектной  группы,
Corporation, Нью – Йорк) "Я работал с Windows и OS/2 в  сети  Banyan  Wines,
используя OverDrive процессор без единой  заминки.  Моя  усовершенствованная
система с i486SX 25 МГц работает не хуже, чем системы на 50 МГц."
       Стив  Симмонс:  (технический     менеджер, Даллас)
"Windows визжит от счастья, когда работает с OverDrive процессором.  Расчеты
на электронной таблице в Excel выполняются мгновенно."


                           3.9. Процессор Pentium.

       В то время, когда Винод Дэм делал первые наброски, начав в июне  1989
года разработку Pentium процессора, он и  не  подозревал,  что  именно  этот
продукт  будет  одним  из  главных  достижений  фирмы  Intel.   Как   только
выполнялся очередной этап проекта, сразу  начинался  процесс  всеобъемлющего
тестирования. Для  тестирования  была  разработана  специальная  технология,
позволившая    имитировать    функционирование    Pentium    процессора    с
использованием  программируемых  устройств,  объединенных  на  14  платах  с
помощью кабелей. Только когда были обнаружены  все  ошибки,  процессор  смог
работать в реальной системе. В дополнение ко всему, в процессе разработки  и
тестирования Pentium процессора  принимали  активное  участие  все  основные
разработчики  персональных  компьютеров  и  программного  обеспечения,   что
немало способствовало общему успеху проекта. В конце 1991 года,  когда  была
завершен макет процессора, инженеры  смогли  запустить  на  нем  программное
обеспечение.  Проектировщики  начали  изучать  под  микроскопом  разводку  и
прохождение сигналов по подложке с целью оптимизации топологии  и  повышения
эффективности работы. Проектирование в основном  было  завершено  в  феврале
1992 года. Началось всеобъемлющее тестирование опытной  партии  процессоров,
в течение которого испытаниям подвергались все блоки и узлы. В  апреле  1992
года было принято решение, что пора начинать промышленное  освоение  Pentium
процессора. В качестве основной промышленной базы была выбрана 5  Орегонская
фабрика. Более 3 миллионов  транзисторов  были  окончательно  перенесены  на
шаблоны. Началось промышленное освоение производства и  доводка  технических
характеристик, завершившиеся через 10 месяцев, 22 марта  1993  года  широкой
презентацией Pentium процессора.
       Объединяя более, чем 3.1 миллион  транзисторов  на  одной  кремниевой
подложке,   32-разрядный   Pentium   процессор    характеризуется    высокой
производительностью с тактовой частотой 60  и  66  МГц.  Его  суперскалярная
архитектура использует усовершенствованные способы  проектирования,  которые
позволяют  выполнять  более,  чем  одну  команду  за  один  период  тактовой
частоты,  в  результате  чего  Pentium  в   состоянии   выполнять   огромное
количество  PC-совместимого  программного  обеспечения  быстрее,  чем  любой
другой   микропроцессор.   Кроме   существующих    наработок    программного
обеспечения, высокопроизводительный арифметический блок с плавающей  запятой
Pentium  процессора  обеспечивает  увеличение  вычислительной  мощности   до
необходимой  для  использования  недоступных  ранее  технических  и  научных
приложений, первоначально предназначенных для платформ рабочих станций.
       Многочисленные  нововведения  -   характерная     особенность
Pentium процессора в виде уникального сочетания высокой  производительности,
совместимости, интеграции данных и наращиваемости. Это включает:
    - Суперскалярную архитектуру;
    - Раздельное кэширование программного кода и данных;
    - Блок предсказания правильного адреса перехода;
    - Высокопроизводительный блок вычислений с плавающей запятой;
    - Расширенную 64-битовую шину данных;
    - Поддержку многопроцессорного режима работы;
    - Средства задания размера страницы памяти;
    - Средства обнаружения ошибок и функциональной избыточности;
    - Управление производительностью;
    - Наращиваемость с помощью Intel OverDrive  процессора.  Cуперскалярная
       архитектура Pentium процессора представляет
собой   совместимую   только   с   Intel   двухконвейерную    индустриальную
архитектуру,    позволяющую    процессору    достигать     новых     уровней
производительности посредством выполнения более, чем одной команды  за  один
период    тактовой    частоты.    Термин     "суперскалярная"     обозначает
микропроцессорную    архитектуру,    которая    содержит    более     одного
вычислительного блока. Эти вычислительные  блоки,  или  конвейеры,  являются
узлами, где происходят все основные процессы обработки данных и команд.
       Появление суперскалярной архитектуры Pentium процессора  представляет
собой естественное развитие предыдущего семейства процессоров  с  32-битовой
архитектурой фирмы Intel. Например, процессор  Intel486  способен  выполнять
несколько своих команд за один период тактовой  частоты,  однако  предыдущие
семейства  процессоров  фирмы  Intel  требовали  множество  циклов  тактовой
частоты для выполнения одной команды.
       Возможность  выполнять  множество  команд  за  один  период  тактовой
частоты  существует  благодаря  тому,  что  Pentium  процессор   имеет   два
конвейера, которые могут выполнять две инструкции одновременно. Так же,  как
и  Intel486  с  одним  конвейером,  двойной  конвейер   Pentium   процессора
выполняет  простую  команду  за  пять  этапов:  предварительная  подготовка,
первое декодирование (  декодирование  команды  ),  второе  декодирование  (
генерация адреса ), выполнение и обратная выгрузка.
       В  результате  этих  архитектурных  нововведений,  по   сравнению   с
предыдущими микропроцессорами, значительно большее количество  команд  может
быть выполнено за одно и то же время.
       Другое важнейшее революционное  усовершенствование,  реализованное  в
Pentium  процессоре,  это  введение  раздельного  кэширования.   Кэширование
увеличивает  производительность  посредством  активизации  места  временного
хранения для часто используемого программного кода и данных,  получаемых  из
быстрой памяти,  заменяя  по  возможности  обращение  ко  внешней  системной
памяти для некоторых команд. Процессор Intel486, например, содержит один  8-
KB блок встроенной кэш-памяти,  используемой  одновременно  для  кэширования
программного кода и данных.
       Проектировщики фирмы  Intel  обошли  это  ограничение  использованием
дополнительного контура, выполненного на 3.1 миллионах транзисторов  Pentium
процессора ( для сравнения, Intel486 содержит 1.2  миллиона  транзисторов  )
создающих раздельное внутреннее кэширование программного кода и данных.  Это
улучшает производительность посредством  исключения  конфликтов  на  шине  и
делает двойное кэширование доступным чаще,  чем  это  было  возможно  ранее.
Например,  во  время  фазы  предварительной  подготовки,  используется   код
команды, полученный из КЭШа команд.  В  случае  наличия  одного  блока  кэш-
памяти,  возможен  конфликт  между  процессом   предварительной   подготовки
команды и доступом к данным. Выполнение раздельного кэширования  для  команд
и  данных  исключает  такие  конфликты,  давая  возможность  обеим  командам
выполняться одновременно. Кэш-память  программного  кода  и  данных  Pentium
процессора содержит по 8 KB информации каждая,  и  каждая  организована  как
набор  двухканального  ассоциативного  КЭШа  -  предназначенная  для  записи
только   предварительно   просмотренного   специфицированного    32-байтного
сегмента, причем быстрее, чем внешний кэш. Все  эти  особенности  расширения
производительности  потребовали  использования  64-битовой  внутренней  шины
данных,   которая   обеспечивает   возможность   двойного   кэширования    и
суперскалярной конвейерной  обработки  одновременно  с  загрузкой  следующих
данных.  Кэш  данных  имеет  два  интерфейса,  по  одному  для  каждого   из
конвейеров, что позволяет ему обеспечивать данными две отдельные  инструкции
в течение одного машинного цикла. После того, как данные достаются из  КЭШа,
они записываются в главную память в режиме обратной  записи.  Такая  техника
кэширования  дает  лучшую  производительность,  чем  простое  кэширование  с
непосредственной  записью,   при   котором   процессор   записывает   данные
одновременно в кэш и  основную  память.  Тем  не  менее,  Pentium  процессор
способен  динамически  конфигурироваться   для   поддержки   кэширования   с
непосредственной записью.
       Таким  образом,   кэширование   данных   использует   два   различных
великолепных решения: кэш с обратной  записью  и  алгоритм,  названный  MESI
(модификация,  исключение,  распределение,  освобождение)  протокол.  Кэш  с
обратной записью позволяет записывать в кэш без обращения к основной  памяти
в отличие от используемого до этого непосредственного простого  кэширования.
Эти  решения  увеличивают   производительность   посредством   использования
преобразованной шины и предупредительного исключения самого узкого  места  в
системе. В свою  очередь  MESI-протокол  позволяет  данным  в  кэш-памяти  и
внешней  памяти  совпадать  -  великолепное  решение  в  усовершенствованных
мультипроцессорных системах, где  различные  процессоры  могут  использовать
для работы одни и те же данные.
       Блок  предсказания  правильного  адреса  перехода  -  это   следующее
великолепное  решение  для  вычислений,   увеличивающее   производительность
посредством  полного  заполнения   конвейеров   командами,   основанное   на
предварительном определении правильного набора команд, которые  должны  быть
выполнены.
       Pentium процессор позволяет выполнять  математические  вычисления  на
более   высоком   уровне   благодаря   использованию    усовершенствованного
встроенного  блока  вычислений  с  плавающей   запятой,   который   включает
восьмитактовый конвейер и аппаратно  реализованные  основные  математические
функции. Четырехтактовые конвейерные команды вычислений с плавающей  запятой
дополняют  четырехтактовую  целочисленную  конвейеризацию.   Большая   часть
команд  вычислений  с  плавающей   запятой   могут   выполняться   в   одном
целочисленном  конвейере,  после  чего  подаются  в  конвейер  вычислений  с
плавающей запятой. Обычные функции вычислений  с  плавающей  запятой,  такие
как сложение, умножение и деление, реализованы аппаратно с  целью  ускорения
вычислений.
       В результате этих  инноваций,  Pentium  процессор  выполняет  команды
вычислений с плавающей запятой в пять раз быстрее, чем 33-МГц  Intel486  DX,
оптимизируя  их  для  высокоскоростных  численных   вычислений,   являющихся
неотъемлемой частью таких усовершенствованных видеоприложений, как CAD и 3D-
графика.
       Pentium процессор снаружи представляет собой  32-битовое  устройство.
Внешняя шина  данных  к  памяти  является  64-битовой,  удваивая  количество
данных, передаваемых в  течение  одного  шинного  цикла.  Pentium  процессор
поддерживает несколько  типов  шинных  циклов,  включая  пакетный  режим,  в
течение которого происходит порция данных из  256  бит  в  кэш  данных  и  в
течение одного шинного цикла.
       Шина данных является главной магистралью, которая передает информацию
между процессором и  подсистемой  памяти.  Благодаря  этой  64-битовой  шине
данных,  Pentium  процессор  существенно  повышает  скорость   передачи   по
сравнению с процессором Intel486 DX - 528 MB/сек для 66  МГц,  по  сравнению
со 160 MB/сек для 50  МГц  процессора  Intel486  DX.  Эта  расширенная  шина
данных  способствует  высокоскоростным   вычислениям   благодаря   поддержке
одновременной   подпитки   командами   и   данными    процессорного    блока
суперскалярных вычислений, благодаря  чему  достигается  еще  большая  общая
производительность Pentium процессора по сравнению  с  процессором  Intel486
DX.
       Давая возможность разработчикам проектировать системы  с  управлением
энергопотреблением,  защитой  и  другими   свойствами,   Pentium   процессор
поддерживаем режим управления системой (SMM),  подобный  режиму  архитектуры
Intel SL.
       Вместе со всем, что сделано нового для  32-битовой  микропроцессорной
архитектуры  фирмы  Intel,  Pentium  процессор  сконструирован  для   легкой
наращиваемости с использованием архитектуры  наращивания  фирмы  Intel.  Эти
нововведения  защищают  инвестиции  пользователей  посредством   наращивания
производительности, которая  помогает  поддерживать  уровень  продуктивности
систем, основанных на  архитектуре  процессоров  фирмы  Intel,  больше,  чем
продолжительность  жизни  отдельных  компонентов.   Технология   наращивания
делает   возможным   использовать   преимущества   большинства   процессоров
усовершенствованной технологи в уже существующих системах с помощью  простой
инсталляции  средства   однокристального   наращивания   производительности.
Например,  первое  средство   наращивания   -   это   OverDrive   процессор,
разработанный для  процессоров  Intel486  SX  и  Intel486  DX,  использующий
технологию  простого   удвоения   тактовой   частоты,   использованную   при
разработке микропроцессоров Intel486 DX2.
       Первые модели процессора Pentium работали на частоте 60 и  66  МГц  и
общались со своей внешней кэш-памятью  второго  уровня  по  64-битовой  шине
данных, работающей на полной скорости процессорного ядра. Hо  если  скорость
процессора Pentium растет, то системному разработчику все труднее  и  дороже
обходится его согласование с материнской платой. Поэтому быстрые  процессоры
Pentium  используют  делитель  частоты  для  синхронизации  внешней  шины  с
помощью меньшей частоты. Hапример, у  100  МГц  процессора  Pentium  внешняя
шина работает на 66 МГц,  а  у  90  МГц  -  на  60  МГц.  Процессор  Pentium
использует одну и ту же шину для доступа к основной памяти и к  периферийным
подсистемам, таким как схемы PCI.


                        3.10. Процессор Pentium Pro.

                     3.10.1. Общее описание процессора.

       Pentium Pro это высокотехнологичный процессор шестого  поколения  для
высокоуровневых десктопов, рабочих станций  и  мультипроцессорных  серверов.
Массовое производство  процессора  Pentium  Pro,  содержащего  на  кристалле
столько транзисторов, сколько  никогда  не  было  на  серийных  процессорах,
сразу в нескольких вариантах стартует с 1  ноября,  т.е.  с  самого  момента
объявления. Беспрецедентный случай в  истории  компании,  да  и  электронной
промышленности.
       Hапомним  некоторые  его  особенности.  Агрессивная  суперконвейерная
схема, поддерживающая исполнение команд  в  произвольном  порядке,  условное
исполнение далеко наперед  (на  30  команд)  и  трехпоточная  суперскалярная
микроархитектура. Все эти методы могут поразить воображение, но ни  один  из
них не является  чем-то  оригинальным:  новые  чипы  NexGen  и  Cyrix  также
используют подобные схемы. Однако, Intel обладает  ключевым  превосходством.
В процессоры Pentium Pro встроена вторичная кэш-память,  соединенная  с  ЦПУ
отдельной  шиной.  Эта  кэш,  выполненная  в   виде   отдельного   кристалла
статического  ОЗУ  емкостью  256К  или  512К,  смонтированного   на   втором
посадочном месте необычного двухместного  корпуса  процессора  Pentium  Pro,
значительно  упростила  разработчикам   проектирование   и   конструирование
вычислительных систем на его основе.
       Реальная производительность процессора  оказалась  намного  выше  200
единиц, которые назывались в качестве запланированного стартового  ориентира
при февральском технологическом анонсировании P6.
       Pentium Pro это значительный шаг вперед. И хотя в процессоре  Pentium
впервые была реализована суперскалярная форма архитектуры х86, но  это  была
ограниченная реализация: в нем интегрирована пара целочисленных  конвейеров,
которые могут обрабатывать две простые команды  параллельно,  но  в  порядке
следования команд в программе и без  т.н.  условного  исполнения  (наперед).
Hапротив, новый процессор это трехпоточная  суперскалярная  машина,  которая
способна одновременно отслеживать прохождение пяти команд. Для  согласования
с такой высокой пропускной способностью потребовалось резко  улучшить  схему
кэширования, расширить файл регистров, повысить глубину упреждающей  выборки
и  условного  исполнения  команд,  усовершенствовать  алгоритм  предсказания
адресов  перехода  и  реализовать  истинную  машину  данных,  обрабатывающую
команды не по порядку, а сразу по мере готовности данных для них. Ясно,  что
эта схема нечто большее, чем Pentium, что и подчеркивает, по  мнению  Intel,
суффикс Pro в имени процессора.



                   3.10.2. Два кристалла в одном корпусе.

       Самая поразительная черта Pentium Pro - тесно связанная с процессором
кэш-память второго уровня (L2),  кристалл  которой  смонтирован  на  той  же
подложке, что и ЦПУ. Именно так, Pentium Pro это два чипа в  одном  корпусе.
Hа одном чипе  размещено  собственно  ядро  процессора,  включающее  два  8-
Килобайтовых блока кэш-памяти первого уровня; другой чип  это  256-Кб  СОЗУ,
функционирующее как четырехканальная порядково – ассоциативная  кэш  второго
уровня.
       Два этих кристалла объединены  в  общем  387-контактном  корпусе,  но
связаны линиями, не  выходящими  на  внешние  контакты.  Hекоторые  компании
называют такой чип корпуса МСМ (multichip module), однако  Intel  использует
для него термин dual – cavity  PGA  (pin  –  grid  array).  Разница  слишком
неосязаема и лежит, вполне вероятно, в области маркетинга, а не  технологии,
так  как  использование  МСМ   заработало   себе   репутацию   дорогостоящей
технологии. Но, сравнивая цены на процессоры Pentium и  Pentium  Pro,  можно
утверждать, что новая  терминология  исправит  положение  дел,  так  как  P6
претендует на статус массового процессора. Впервые в истории  промышленности
многокристальный модуль станет крупносерийным изделием.
       Степень интеграции нового процессора также поражает: он содержит  5.5
млн. транзисторов, да еще 15.5 млн. входит в  состав  кристалла  кэш-памяти.
Для сравнения, последняя версия  процессора  Pentium  состоит  из  3.3  млн.
транзисторов. Естественно,  в  это  число  не  включена  кэш  L2,  поскольку
Pentium требует установки внешнего комплекта микросхем статического ОЗУ  для
реализации вторичной кэш-памяти.
       Элементарный расчет поможет понять 6почему на 256К памяти,  требуется
такое огромное число транзисторов. Это статическое ОЗУ,  которое  в  отличие
от  динамического,  имеющего  всего  один  транзистор  на  бит  хранения   и
периодически регенерируемого, использует для хранения бита ячейку  из  шести
транзисторов:
       256 x 1024 х 8 бит х 6 пр – ров  = 12.5 млн. транзисторов.  С  учетом
буферов и обвязки накопителя как раз и выйдет 15.5 миллионов.
       Площадь процессорного кристалла равна 306 кв. мм. (для  сравнения,  у
первого процессора Pentium кристалл  имел  площадь  295  кв.  мм).  Кристалл
статической  памяти,  как  всякая  регулярная  структура,  упакован  намного
плотнее - 202 кв. мм. Только Pentium Pro 150  MHz  изготавливается  по  0.6-
микронной   технологии.   Все    остальные    версии    нового    процессора
изготавливаются  по  0.35-микронной   BiCMOS-технологии   с   четырехслойной
металлизацией.
       Почему компания Intel пошла  на  двухкристалльный  корпус,  объединив
ядро ЦПУ с вторичным КЭШем? Во – первых комбинированный  корпус  значительно
упростил  изготовителям  ПК  разработку  высокопроизводительных  систем   на
процессоре Pentium Pro.
       Одна из главных проблем  при  проектировании  компьютера  на  быстром
процессоре связана с точным согласованием с процессором вторичного  КЭШа  по
его размеру  и  конфигурации.  Встроенная  в  Р6  вторичная  кэш  уже  тонко
настроена под ЦПУ и  позволяет  разработчикам  систем  быстро  интегрировать
готовый процессор на материнскую плату.
       Во-вторых,  вторичная  кэш  тесно  связана  с  ядром  ЦПУ  с  помощью
выделенной шины шириной 64 бита, работающей на  одинаковой  с  ним  частоте.
Если ядро синхронизируется частотой 150  МГц,  то  кэш  должна  работать  на
частоте 150 МГц.
       Поскольку  в  процессоре  Pentium  Pro  есть  выделенная   шина   для
вторичного КЭШа, это решает сразу две  проблемы:  обеспечивается  синхронная
работа двух устройств на полной скорости и отсутствие конкуренции за шину  с
прочими операциями ввода-вывода. Отдельная шина L2, "задняя" шина  полностью
отделена  от  наружной,  "передней"  шины  ввода-вывода,  вот  почему  в  P6
вторичная кэш не  мешает  своими  циклами  операциям  с  ОЗУ  и  периферией.
Передняя 64-битовая шина может работать с частотой, равной  половине,  трети
или четверти скорости ядра Pentium Pro. "Задняя"  шина  продолжает  работать
независимо, на полной скорости.
       Такая реализация представляет серьезный шаг  вперед  по  сравнению  с
организацией шины  процессора  pentium  и  других  процессоров  х86.  Только
NexGen приближенно напоминает такую схему. Хотя в процессоре Nx586 нет  КЭШа
L2, зато встроен ее контроллер и полноскоростная шина для  связи  с  внешней
кэш-памятью. Подобно Р6, процессор  Nx586  общается  с  основной  памятью  и
периферийными подсистемами поверх отдельной  шины  ввода-вывода,  работающей
на деленной частоте.
       В экзотическом процессором Alpha 21164  компания  Digital  пошла  еще
дальше, интегрировав прямо на кристалле в дополнение к первичной  кэш-памяти
еще и 96 Кбайт вторичной. За счет  вздувания  площади  кристалла  достигнута
беспрецедентная производительность кэширования. Транзисторный  бюджет  Альфы
составляет 9.3 миллиона  транзисторов,  большая  часть  которого  образована
массивом памяти.
       Есть одна незадача: необычный дизайн Pentium Pro, пожалуй,  затруднит
экспертам  задачку  вычисления  соотношения   цены   и   производительности.
Интегрированная в процессор кэш вроде как скрыта с глаз. Pentium Pro  сможет
показаться более дорогим, чем его конкуренты, но для создания компьютера  на
других  процессорах  потребуется  внешний  набор  микросхем  памяти  и  кэш-
контроллер.  Эффективный   дизайн   кэш-структуры   означает,   что   другим
процессорам, претендующим на  сопоставимую  производительность,  потребуется
кэш-памяти больше, чем 256 Кбайт.
       Уникальный корпус  предоставляет  свободу  созданию  новых  вариантов
процессора. В будущем возможно как повышение объема  кэш-памяти,  так  и  ее
отделение ее от процессора в  соответствии  с  традиционным  подходом.  Если
последний вариант появится, он окажется, несовместим по  внешним  выводам  с
двухкристалльным базовым  корпусом,  так  как  ему  необходимо  добавить  72
дополнительных вывода (64-для "задней" шины и 8 для контроля ошибок). Hо  он
будет почти таким же быстрым, если будет широко доступна статическая  память
с  пакетным  режимом.  По  мнению  инженеров  Intel,   подключение   внешних
микросхем памяти к "передней" шине  Pentium  Pro  с  целью  реализации  кэш-
памяти третьего уровня,  вряд  ли  оправдано.  Отправной  точкой  для  такой
убежденности служат результаты натурного  моделирования  прототипа  системы,
которая в  следствии  высокой  эффективности  интерфейса  кэш  L2-процессор,
практически  до  теоретического  предела  загружает  вычислительные  ресурсы
ядра. Процессор Alpha 21164, напротив, спроектирован с учетом  необходимости
кэш L3.



          3.10.3. Значения тестов для некоторых чипов фирмы Intel.


|Processor    |Intel   |Intel   |Intel   |Intel   |Intel   |
|Benchmarks   |Pentium |Pentium |Pentium |Pentium |Pentium |
|             |Pro     |Pro     |Pro     |Pro     |Processo|
|             |Processo|Processo|Processo|Processo|r       |
|             |r       |r       |r       |r       |(133MHz)|
|             |(200MHz)|(180MHz)|(166MHz)|(150MHz)|        |
|             |        |        |        |        |        |
|             |        |        |w/512K  |        |        |
|             |        |        |L2      |        |        |
|UNIX         |        |        |        |        |        |
|SPEC95       |8.09    |7.29    |7.11    |6.08    |4.14    |
|SPECint95    |8.09    |7.29    |7.11    |6.08    |4.14    |
|SPECint_base9|6.75    |6.08    |6.21    |5.42    |3.12    |
|5            |5.99    |5.40    |5.47    |4.76    |2.48    |
|SPECfp95     |        |        |        |        |        |
|SPECfp_base95|        |        |        |        |        |
|SPEC92       |366.0   |327.4   |327.1   |276.3   |190.9   |
|SPECint92    |336.7   |3.5.8   |306.6   |258.3   |175.9   |
|SPECint_base9|283.2   |254.6   |261.3   |220.0   |120.6   |
|2            |234.3   |210.4   |209.6   |182.0   |107.3   |
|SPECfp92     |        |        |        |        |        |
|SPECfp_base92|        |        |        |        |        |
|Windows      |        |        |        |        |        |
|Norton System|86.7    |77.6    |Not     |67.0    |34.2    |
|Index        |        |        |tested  |        |        |
|SI32         |        |        |        |        |        |
|Ziff-Davis   |541     |466     |Not     |412     |278     |
|CPUmark32    |        |        |tested  |        |        |



                      4. Процессоры конкурентов Intel.

                  4.1. Первые процессоры конкурентов Intel.

       Intel была не единственной фирмой - производителем  микропроцессоров:
существовали еще MOS  Technologies,  Mostek,  Motorola,  Rockwell,  Standart
Microsystems  Corporation,  Synertek,  Texas  Instruments.   Одни   из   них
использовали свои собственные проекты чипов, другие -  лицензионные  проекты
своих конкурентов. Успешнее всех в конце  70-х  работала  фирма  Zilog.  Она
создала чип Z80.
       В то  время,  когда  компьютеры,  работающие  под  управлением  СР/М,
распространились в офисах, компьютеры Apple II буквально ворвались в  школы.
Фирма Apple в качестве основного компонента своего  компьютера  выбрала  чип
фирмы MOS Technologies 6502. Это был лицензионный  чип  фирмы  Rockwell  and
Synertek. Apple  начала  использовать  процессоры  Motorola  во  всех  своих
компьютерах Macintosh. Разработки фирм  Intel  и  Motorola  появились  почти
одновременно, но объединяет их не только это. Микропроцессоры Intel 80486  и
Motorola  68040,  например,   почти   одинаковы   по   сложности   и   имеют
функциональные  сходные  возможности.   Тем   не   менее,   они   совершенно
несовместимы. Именно поэтому на Macintosh и PC не могут выполняться  одни  и
те же программы.
       Существует принципиальное отличие в эволюционном развитии  этих  двух
семейств микропроцессоров. Intel начала с довольно незначительного по  нашим
современным меркам адресного пространства в 1 Мбайт и  постоянно  наращивала
его до нынешнего размера в 4 Гбайт. Motorola  в  своей  серии  680x0  всегда
имела адресное пространство в 4 Гбайт. IBM поместила  чипы  ROM  в  адресное
пространство своих PC как можно выше. И не ее ошибка была в том,  что  позже
Intel достроила "второй этаж" и таким образом оставила  ROM  в  конструкциях
IBM где-то посередине, открыв дорогу использованию RAM, что  само  по  себе,
может быть, и не  плохо.  Разработчики  семейства  чипов  680х0  никогда  не
испытывали подобных неудобств, и поэтому очень много программистов  считают,
что Mac лучше.
       Intel  приложила   значительные   усилия,   пытаясь   стандартизовать
производство  ее  процессоров  8086  и  8088  на   предприятиях-подрядчиках.
Hесколько предприятий приняло такие соглашения. Однако Haris  выпустил  свои
чипы - аналоги 8086 и 8088, которые менее всего удовлетворяли этим  принятым
соглашениям.  Он  использовал  технологию  CMOS,   значительно   сокращающую
потребление  электроэнергии,  и  это  свойство  сделало   его   чипы   очень
популярными,  особенно  среди  производителей  ПК  с  экранами   на   жидких
кристаллах.
       Фирма NEC предложила свою так называемую V-серию  чипов  и  объявила,
что чип V20 является конструктивно совместимым с чипом Intel 8088, но  имеет
усовершенствованный набор инструкций, включая при  этом  и  инструкции  чипа
8080. Это означало, что он мог легко  выполнять  программы,  написанные  для
CP/M, без их модификации, используя эмулятор программ, и при  этом  включать
преимущества инструкций 8080, содержащихся  в  чипе  V20.  Их  чип  V30  был
аналогом 8086 с включенными дополнительными возможностями.
       Чипы V-серии фирмы NEC также  работали  немного  быстрее  аналогичных
чипов фирмы Intel. Эти чипы имели некоторый успех,  чем  была  раздосадована
Intel. Последняя подала в суд на NEC по  факту  нарушения  закона  о  защите
авторских прав. NEC подала ответный иск. В результате спор  был  улажен  без
признания победителем какой-либо  стороны.  Интересными  были  детали  этого
судебного   разбирательства.   Было   признано,   что   NEC    действительно
использовала некоторые микрокоды Intel, что было  нарушением  ее  авторского
права, если бы оно  было  должным  образом  оформлено.  Hо  поскольку  Intel
производила и продавала некоторые чипы 8088 без знака авторского  права,  то
их  претензии  были   признаны   безосновательными.   Компания   Chips   and
Technology, которая  стала  известна  благодаря  выпуску  аналогов  BIOS,  в
настоящее время внедрила линию по производству процессорных  чипов.  Hа  ней
выпускаются аналоги 386. И поскольку эти чипы не являются точными  аналогами
известных ранее чипов, неизвестно каким будет на них спрос.



                         4.2. Процессоры фирмы AMD.

                  4.2.1. Судебное разбирательство с Intel.

       Фирма AMD была лицензионным производителем Intel, производящей 80286.
AMD объявила, что ее контракт с Intel позволяет им выпускать  легализованные
копии чипов 386. Intel категорически не  согласилась  с  этим.  AMD  удалось
выиграть это судебное разбирательство, и теперь она  выпускает  аналог  чипа
386 с тактовой  частотой  40  МГц.  Этот  чип  имел  определенный  успех,  в
частности,  из-за  его  более  высокой  скорости  по   сравнению   с   самым
быстродействующим чипом серии Intel 386. При  выпуске  фирмой  AMD  аналогов
486 фирма Intel снова попыталась остановить  конкурента.  Однако  и  в  этом
случае закон был на стороне AMD.



                    4.2.2. Процессоры семейства AMD5k86.

       Наладив в 1994 году массовое  производство  чипов  5-го  поколения  -
микропроцессоров  Pentium,   корпорация   Intel   мощно   пошла   в   отрыв.
Интеллектуальная колоссальная мощь ее инженеров, помноженная  на  богатейшие
производственные  возможности,  казалось,  не   оставляла   никаких   шансов
конкурентам.  между  тем  вдогонку  за  лидером  бросилось  сразу  несколько
преследователей.  Среди  них,  пожалуй,  именно  компания  AMD  имела  самую
"удачную"  стартовую  позицию.  Компания  Advanced  Micro  Devices  занимала
второе место в мире по производству микропроцессоров.  На  сегодняшний  день
общее число чипов, выпущенных фирмой AMD, перевалило далеко  за  отметку  85
миллионов, что, согласитесь, само по себе  говорит  об  огромном  потенциале
компании.
       Цифра "5" для фирмы AMD была явно  несчастливой.  Intel  Pentium  все
наращивал  обороты:  66,  75,  90  Мгц...  Тактовая  частота  новых  моделей
увеличивалась едва ли не каждый месяц. А разработчикам компании  AMD,  кроме
названия - "K5", представлять было решительно нечего.  Ожидание  становилось
тягостным.
       Гнетущее  ощущение  несбывшихся  надежд  скрасил  выпуск   процессора
Am5x86. Нет, чип Am5x86 не  был  обещанным  К5.  Микропроцессор  представлял
собой  "четверку"  с  большими  возможностями,  которые  однако,   явно   не
дотягивали  до  "честного"  Pentium.  В   прессе   распространялись   мнения
специалистов, вроде: "Производительность,  сравнимая  с  производительностью
Pentium,  позволяет  отнести  микропроцессор  Am5x86  к  устройствам  пятого
поколения".
       А между тем, оставаясь по своей сути (по внутренней  архитектуре)  до
боли знакомым 486-м, чип Am5x86,  имеющий  тактовую  частоту  133  МГц,  мог
соперничать на равных лишь со скромным  по  своим  возможностям  процессором
Pentium/75 МГц. Интересно,  какой  должна  была  бы  быть  тактовая  частота
Am5x86, чтобы показать производительность, сравнимую с Pentium/166 МГц!
       Поэтому создание чипа пятого  поколения  у  компании  Advanced  Micro
Devices было еще впереди. При проектировании  своих  предыдущих  процессоров
компания опиралась на неизменную поддержку корпорации  Intel.  Но  к  началу
разработки  собственного   процессора   пятого   поколения   срок   действия
лицензионных соглашений  с  корпорацией  Intel  подошел  к  концу.  Так  что
инженерам AMD пришлось начать разработку, что называется, с  чистого  листа.
В частности, вышла промашка  при  проектировании  встроенного  КЭШа  команд.
Наборы команд  для  процессоров  разных  поколений  существенно  отличаются.
Инженеры-разработчики компании AMD немного просчитались в оценке числа CISC-
инструкций, имеющих различную длину.  В  результате,  не  удавалось  достичь
проектируемого   уровня   производительности   при   исполнении    программ,
оптимизированных под процессор Pentium. Но спустя некоторое время и  эта,  и
некоторые другие ошибки были устранены. И в конце марта 1996  года  компания
AMD с гордостью объявила  о  появлении  на  свет  нового  процессора  пятого
поколения - AMD5k86.



                4.2.2.1 Экскурсия по внутренней архитектуре.

       Процессор AMD5k86, известный на  стадии  разработки  как  AMD-K5  или
Krypton,  является  первым  членом  суперскалярного  семейства  (Superscalar
family) K86.  Он  соединяет  в  себе  высокую  производительность  и  полную
совместимость с операционной системой Microsoft Windows.
       Суперскалярный RISC-процессор AMD5k86 выполнен по 0ю35-микронной КМОП
– технологии (complimentary metal – oxid semiconductor  process)  и  состоит
из 4.3 млн.  транзисторов.  Его  дизайн  базируется  на  богатой  истории  и
обширном опыте архитектур RISC и х86.
       По  мнению  многих  специалистов,  разработчики  чипа  AMD5k85  пошли
значительно дальше первоначального замысла: создать процессор, имеющий RISC-
ядро,  и  при  этом  совместимый   с   набором   инструкций   х86   означает
совместимость  с  операционными  системами  Microsoft  Windows  и  всем  ПО,
написанным  под  архитектуру  х86.  Столь  счастливое  сочетание  высочайшей
производительности и полной совместимости с  Microsoft  Windows  делает  чип
AMD5k86 полноправным членом 5-го поколения микропроцессоров.
       Микропроцессор  AMD5k86  имеет  4-потоковое  суперскалярное  ядро   и
осуществляет полное переупорядочивание выполнения инструкций (full out –  of
–  order   execution).  Чип  AMDk586  унаследовал  лучшие  черты   от   двух
доминирующих на сегодняшний день микропроцессорных ветвей: семейства  х86  и
суперскалярных RISC-процессоров. От первых он унаследовал столь  необходимую
для  успешного   продвижения   на   компьютерном   рынке   совместимость   с
операционной системой WINDOWS. От семейства суперскалярных  RISC-процессоров
он  унаследовал  высочайший  уровень  производительности,  характерный   для
чипов, применявшихся в рабочих станциях.
       Разработанный  инженерами  компании  AMD   процесс   предварительного
декодирования позволяет  преодолеть  присущие  архитектуре  х86  ограничения
(различная длина инструкций). В случае  использования  инструкций  различной
длины, чипы  4-го  поколения  могут  одновременно  обрабатывать  1  команду,
процессоры 5-го поколения (Pentium) - 2  команды.  И  только  микропроцессор
AMD5k86 способен обрабатывать до 4 инструкций за такт.
       Использование  раздельного  КЭШа  инструкций  и  данных  (объем  КЭШа
инструкций  в  два   раза   превосходит   объем   КЭШа   данных)   исключает
возникновение возможных внутренних конфликтов.
       Сейчас выпускаются микропроцессоры AMD5k86-P75, AMD5k86-P90 и AMD5k86-
P100 производительность которых  (Р.  -  рейтинг)  соответствует  процессору
Pentium с тактовыми частотами 75, 90 и 100 МГц.
       Компания Advanced Micro Devices планирует  выпустить  в  этом  (1996)
году 3 млн. процессоров семейства AMD5k86 со значениями Р. - рейтинга от  75
до 166. Цены на новые  процессоры  будут  сопоставимы  с  ценами  обладающих
аналогичной  производительностью   процессоров   Pentium,   вероятно,   даже
несколько ниже. Средняя цена процессора AMD5k86-P75  составляет  около  $75,
чипа AMD5k86-P90 - $99.
       Характеристики микропроцессора AMD5k86:
    -  4-потоковое  суперскалярное  ядро  с  6-ю  параллельно   работающими
исполнительными устройствами, составляющими 5-ступенчатый конвейер;
    - 4-потоковый ассоциативный кэш команд с линейной адресацией объемом 16
Кб;
    - 4-потоковый ассоциативный кэш данных с обратной  записью  и  линейной
адресацией объемом 8 Кб;
    -  полное  переупорядочивание  выполнения  инструкций,  предварительное
(speculative) исполнение;
    - динамический кэш  предсказания  переходов  объемом  1  Кб;  в  случае
неправильного предсказания задержка составляет менее 3 внутренних тактов;
    -  80-разрядное  интегрированное,   высокопроизводительное   устройство
выполнения операций  с  плавающей  запятой,  обладающее  небольшим  временем
задержки при выполнении операций +/*;
    - питающее напряжение - 3В, система SSM (System  Management  Mode)  для
уменьшения потребляемой мощности;
    - 64-разрядная шина и  системный  интерфейс  помещены  в  296-контакный
корпус  SPGA,  совместимый  по  выводам  с  процессором  Pentium  (P54C)   и
процессорным гнездом Socket-7;
    - полная совместимость с Microsoft Windows и инсталлированной базой  ПО
для процессоров архитектуры х86.


           4.2.2.2. Пример маркировки микропроцессора AMD5k86-P75.

         ---------------------------------------------
         |   ####   ###   ### ######     -----------     |\
         |  ##  ##  ## ### ## ##   ##     `\------ |     |\
         |  ######  ##  #  ## ##   ##      /|    | |     |\
         |  ##  ##  ##     ## ######      | ----,| |     |\
         |                                ----/   \|      |\
   1 --------------------    |\
   2 -------- AMD5k86тм-Р75   |\
   3 ------------------------       |\
   4 -------- AMD-SSA/5-75ABQ      |\
         |   E  |  Designed for     |\
   5 ----------------------- /\/------- |\
         |   (m) (c)1996AMD  /\/------- |\
         |  /\/------- |\
         |  Microsoft  |\
   6 -------- HEAT SINK      ---------- |\
         \   AND FAN REQ'D   Windows 95 тм    |\
         \ |\
                                   `----------------------------------------
--\
                                                \ \ \ \ \ \ \ \ \ \ \ \ \  \
\ \ \ \ \ \ \ \

                   Обозначения:
  1. P-рейтинг    5. Питающее напряжение
  2. Название     B=3.45 - 3.60B
  3. Температура корпуса     C=3.30 - 3.465B
     W=55C  R=70C      F=3.135 - 3.465B
     Q=60C  Y=75C      H=2.76 - 3.0B
     X=65C  Z=85C      J=2.57 - 2.84B
  4. Серийный номер    K=2.38 - 2.63B
               6. Температурный режим



                               4.2.2.3. Тесты.

       Система Р – рейтингов измерения производительности  процессоров  была
предложена в начале 1996 года компаниями AMD, Cyrix, IBM  и  SGS  –  Thomson
Microelectronics.  P-рейтинг   составляется,   по   результатам   проведения
эталонного теста Winstone 96,  разработанного  издательством  Ziff  –  Davis
Этот  тест  представляет  собой  набор  из  13  наиболее  часто  применяемых
приложений, таких как Microsoft Word и Exel.
       Следует заметить, что в отличие  от  системы  тестов  iComp,  которой
пользуется   корпорация   intel   для   оценки   производительности    своих
микропроцессоров, тестовый набор Winstone 96 является общедоступным.
       В  своем  новом  чипе  AMD5k86  компания   AMD   воплотила   поистине
новаторское  сочетание  набора  инструкций  х86   и   суперскалярной   RISC-
архитектуры  (reduced   instruction   set   computing   architecture).   Как
утверждают   некоторые   специалисты   AMD,   благодаря    такому    решению
микропроцессор AMD5k86 обеспечивает на 30% большую  производительность,  чем
процессор  Pentium  с  такой  же  тактовой  частотой.  Впрочем,   результаты
тестирования с использованием пакета тестов  Winstone  96  компании  Ziff  –
Davis показывают, что преимущество несколько скромнее.
Тестовая конфигурация:
|Материнская плата |FIC PA2002                             |
|Чипсет            |VIA Apollo Master                      |
|ОЗУ               |EDO DRAM объемом 16 Мб                 |
|Кэш-память L2     |256 Кб                                 |
|Видеоплата        |PCI Diamond Stealth64 3200             |
|(640х480х256)     |Diamond GT 4.02.00.218 for Windows 95  |
|Видеодрайвер      |EIDE Quantum Fireball емкостью 1.2 Гб  |
|Жесткий диск      |                                       |


AMD5k85-P75 CPU (index 48.8)
                 Pentium 75 (index 47.4)
AMD5k85-P90 CPU (index 56.7)
                 Pentium 90 (index 54.9)


                   4.2.2.4. Материнские платы для AMD5k86.
         Список широко распространенных системных плат,  протестированных  в
         лабораториях компании AMD и
        рекомендованных для установки  процессора AMD5k86.
|Производитель |Модель        |Чипсет       |BIOS             |
|Abit          |PH5 1.3       |SiS 551      |Award Pentium PCI|
|              |              |             |Sys BIOS (N35)   |
|Abit          |PH5 2.1       |Intel Triton |Award Pentium PCI|
|              |              |             |Sys BIOS (C4)    |
|Atrend        |ATC1000       |Intel Triton |Award            |
|              |              |             |i430-2A59CA29C-00|
|Atrend        |ATC1545 A1    |OPTi Viper   |Award OPTi Viper |
|              |              |             |ATS-1545 ver.    |
|              |              |             |0.6.             |
|Biostar       |8500TAC A1    |Intel Triton |AMI 1993         |
|ECS           |TR5510        |Intel Triton |Award            |
|              |              |             |i430FX-2A59CE1NC-|
|              |              |             |00               |
|ECS           |AIO           |Intel Triton |Award            |
|              |              |             |i430FX-2A59CE1NC-|
|              |              |             |00               |
|FIC           |PA2002 1.21   |VIA 570      |Award 4.052G800  |
|Gigabyte      |GA586ATS 1B   |Intel Triton |Award Intel 430FX|
|              |              |             |PCI-ISA v.1.26   |
|Hsingtech     |M507 1.1      |Intel Triton |Award 2/1/1996x  |
|Mycomp (TMC)  |PCI54ITS 2.00 |Intel Triton |Award            |
|              |              |             |i430FX-2A59CM29C-|
|              |              |             |00               |
|Замечание: ранние версии указанных системных плат нуждаются в|
|замене BIOS на более новую версию, правильно распознающую чип|
|AMD5k86                                                      |


                    4.2.2.5. AMD планирует выпустить K5.

       Репутация AMD сильно зависит от успешности затянувшегося проекта  К5-
первой самостоятельной пробы архитектурных сил в области  х86.  Рождение  К5
опасно откладывается уже не первый раз. В первом  квартале  следующего  года
AMD планирует перевод K5 на технологический  процесс  с  проектными  нормами
0.35 мкм и с трехуровневой металлизацией, разработанный при содействии с  HР
и запускаемый на новом заводе AMD Fab 25 в Остине, штат Техас. Это  позволит
уменьшить К5 с
4.2 миллионами транзисторов до 167 кв. мм и поднять процент  выхода  годных,
а также тактовую частоту.
       По мнению  руководства  AMD  в  1996  году  объем  выпуска  К5  будет
наращиваться достаточно быстро, что позволит отгрузить до конца  года  более
пяти миллионов процессоров. Ответом на вызов Intel с ее процессором  Pentium
Pro может стать только процессор К6, но уже никто не верит, что его  удастся
увидеть раньше  1997  года.  Hесмотря  на  всемирный  переход  на  процессор
Pentium, в следующем году еще могут сохраниться некоторые рынки  для  486-х.
Эксперты считают, что потребность  таких  региональных  рынков,  как  Китай,
Индия, Россия, Восточная Европа и Африка,  в  486-х  чипах  составит  до  20
миллионов процессоров в 1996 году. AMD рассчитывает, что именно  ей  удастся
поставить большую часть  от  этого  количества.  Поэтому  компания  повышает
тактовую частоту 486-х до 133 Мгц, чтобы конкурировать  с  низшими  версиями
процессора Pentium в настольных ПК  начального  уровня.  Однако,  AMD  будет
усиленно наращивать выпуск К5, поскольку 486-е быстро выходят из моды.


                           4.3. Процессоры NexGen.

       В то время: как компания Intel готовила отрасль к шокирующему  выходу
в жизнь серийных моделей серверов и настольных машин на Pentium  Pro,  фирма
NexGen представляла форуму свои планы по разработке процессора  Nx686.  Этот
суперскалярный   х86-совместимый   процессор,    к    разработке    которого
подключается еще и  команда  архитекторов  из  AMD,  снятых  с  собственного
неудачного проекта К6, будет содержать около 6  млн.  транзисторов,  включая
вычислитель с плавающей точкой на одном кристалле с  процессором  (отказ  от
предыдущего двухкристалльного подхода, ослабившего Nx586).  Технология  КМОП
с  проектными  нормами  0,35  мкм  и  пятислойной  металлизацией   позволила
"упаковать"  на  одном  кристалле  семь  исполнительных   узлов:   два   для
целочисленных,  один  для  операций  с  плавающей  точкой,  по  одному   для
обработки мультимедиа, команд переходов, команд загрузки  и  команд  записи.
Показатели производительности представители NexGen  назвать  не  смогли,  но
выразили предположение,  что  он  превзойдет  Pentium  Pro  на  16-разрядных
программах вдвое, а на 32-битовых - на 33 %.
       До сих  пор  мало  что  известно  про  Nx686,  так  как  чип  еще  не
анонсировался и NexGen не хочет раскрывать козыри перед конкурентами в  лице
AMD, Cyrix  и  Intel.  Однако,  NexGen  не  хочет  раскрывать  козыри  перед
конкурентами в лице AMD, Cyrix и Intel. Однако,  NexGen  настаивает  о  том,
что Nx686 по производительности сопоставим с интеловским Pentium Pro  и  AMD
K5, и наследует микроархитектуру Nx586,  появившуюся  в  1994  году.  NexGen
называет ее RISC86. Базовая ее идея, как и в случае  с  Pentium  Pro  и  K5,
состоит в преобразовании сложных CISC-команд программного обеспечения x86  в
RISC-подобные операции, исполняемые параллельно в  процессорном  ядре  RISC-
типа. Этот подход, известный  под  названием  несвязанной  микроархитектуры,
позволяет обогатить CISC-процессор новейшими достижениями RISC-архитектур  и
сохранить совместимость с имеющимся ПО для х86.
       В Nx686 эта философия продвинута на новый логический уровень. Сегодня
в Nx586 имеется три  исполнительных  блока,  трехконвейерное  суперскалярное
ядро.  Он  способен  выполнять  в  каждом  такте  по  одной   команде   х86.
Возможности для  совершенствования  очевидны:  Nx586  будет  содержать  пять
исполнительных блоков, четыре конвейера  и  несколько  декодеров,  способных
справиться с выполнением двух или даже более команд  х86  за  один  машинный
такт. Для этого потребуется встроить дополнительные регистры  переименования
и очереди команд.
       Подход к использованию интегрированного кэш-контроллера и  интерфейса
для  скоростной  кэш-памяти  остается   неизменным.   Представители   NexGen
говорят, что они изучают возможность использования кристалла вторичной  кэш-
памяти по образцу  и  подобию  Intel,  тем  более  что  их  производственный
партнер  IBM  Microelectronics  способен   делать   статическую   память   и
многокристальные сборки (MCM - multichip modules).
       Пример практической реализации технологии МСМ фирмы IBM  представляет
новая версия процессора Nx586, запланированная  к  выпуску  на  конец  этого
года и  включающая  кристалл  CPU  и  FPU  в  одном  корпусе.  Одновременное
перепроектирование  топологии  с  масштабированием  до  размера  линии  0.35
микрон позволит компании NexGen  основательно  уменьшить  размеры  кристалла
ЦПУ - до 118 кв. мм - меньше в этом классе ничего нет.
       NexGen, новичок в группе производителей процессоров х86. Nx596  может
параллельно обрабатывать на  нескольких  исполнительных  блоках  до  четырех
простейших операций, которые названы командами RISC86.  Процессор  К5  имеет
похожий  четырехпоточный  дешифратор,  но  результаты  его  работы  компания
называет R – ops.



                           4.4. Процессоры Cyrix.

       Первая вещь  из  грандиозного  проекта  М1  компании  Cyrix,  наконец
обнародована. Это процессор Сх 6х86-100, монстроподобный  кристалл  которого
сложен и очень дорог для того,  чтобы  претендовать  на  массовый  выпуск  в
течении длительного срока. Его проблемы  сможет  решить  процессор,  который
пока  имеет  кодовое  название  M1rx  и  опирающийся  на  техно  процесс   с
пятислойной металлизацией, идущий на смену трехслойной версии  той  же  0.6-
мкм технологии. Если проект увенчается успехом, то размер  кристалла  с  394
кв. мм уменьшится до 225  кв.  мм,  тогда  у  Cyrix  появится  шанс  поднять
тактовую частоту до 120  МГц.  В  этом  случае  эксперты  предсказывают  ему
производительность в пределах 176-203 по тесту  SPECint92,  т.е.  на  уровне
процессора Pentium 133 (SPECint92=190.9) или  150  МГц.  Если  все  обещания
сбудутся, то Cyrix сможет продать столько процессоров,  сколько  произведет.
Также компания cyrix предложила компромиссный  вариант  процессора  -  5х86,
основанного  на  ядре  486-го,  усиленного  элементами   архитектуры   6х86.
Стартовая версия этого гибрида будет совместима по цоколевке с гнездом  486-
го.


                      4.5. Процессоры Sun Microsystems.

       Sun  Microsystems  процессор  UltraSparc-II.  Впервые   вводя   RISC-
технологию, SUN  в  1988  году  объявила  SPARC  в  качестве  масштабируемой
архитектуры,  с  запасом  на  будущее.  Однако,  с  1993   года   реализация
SuperSparc стала на шаг отставать от своих конкурентов.
       С появлением  UltraSparc,  четвертого  поколения  архитектуры  SPARC,
компания  связывает  надежды  на  восстановление  утраченных   позиций.   Он
содержит  ни  много,  ни  мало,  но  девять   исполнительных   блоков:   два
целочисленных АЛУ, пять  блоков  вычислений  с  плавающей  точкой  (два  для
сложения, два для умножения и одно  для  деления  и  извлечения  квадратного
корня),  блок  предсказания  адреса   перехода   и   блок   загрузки/записи.
UltraSparc содержит блок обработки переходов,  встроенный  в  первичную  кэш
команд, и условно выполняет предсказанные переходы,  но  не  может  выдавать
команды  с  нарушением  их  очередности.  Эта  функция  перекладывается   на
оптимизирующие компиляторы.
       Архитектура  SPARC  всегда  имела  регистровые  окна,   т.е.   восемь
перекрывающихся банков по 24 двойных регистра, которые  могут  предотвратить
остановки  процессора  в  моменты  комплексного  переключения,  связанные  с
интенсивными записями в память. Разработчики  компиляторов  склонны  считать
эти  окна  недостаточным  решением,  поэтому   в   UltraSparc   используется
иерархическая система несвязанных шин.  Шина  данных  разрядностью  128  бит
работает на  одной  скорости  с  ядром  процессора.  Она  соединяется  через
буферные микросхемы с 128-разрядной системной шиной, работающей на  частоте,
составляющей половину, треть или четверть скорости процессорного  ядра.  Для
согласования с более "медленной" периферией служит шина ввода-вывода Sbus.
       Фирма  Sun  реализует  эту  схему  на  аппаратном  уровне  с  помощью
коммутационной микросхемы, являющейся составной  частью  схемного  комплекта
окружения. Эта микросхема может  изолировать  шину  памяти  от  шины  ввода-
вывода, так что ЦПУ продолжает, например, запись  в  графическую  подсистему
или в иное устройство ввода-вывода, а не  останавливается  во  время  чтения
ОЗУ.  Такая  схема  гарантирует  полное  использование   ресурсов   шины   и
установившуюся пропускную способность
1.3 Гигабайт/с.
       В процессоре UltraSparc  –  II  используется  система  команд  Visual
Instruction Set (VIS), включающая  30  новых  команд  для  обработки  данных
мультимедиа,  графики,  обработки   изображений   и   других   целочисленных
алгоритмов. Команды VIS включают операции сложения, вычитания  и  умножения,
которые позволяют выполнять до  восьми  операций  над  целыми  длинной  байт
параллельно с операцией загрузки или записи в память и с операцией  перехода
за один такт. Такой подход может повысить видеопроизводительность систем.



                     4.6. Процессоры Digital Equipment.

       Digital Equipment процессор Alpha наиболее тесно следует в русле RISC-
философии по сравнению со своими конкурентами,  "посрезав  излишки  сала"  с
аппаратуры и  системы  команд  с  целью  максимального  спрямления  маршрута
прохождения данных. Разработчики Alpha уверены, что  очень  высокая  частота
чипа даст вам большие преимущества, чем причудливые  аппаратные  излишества.
Их принцип сработал: кристалл 21164 был самым быстрым в мире процессором  со
дня своего появления в 1995 году. Процессор 21164  в  три  раза  быстрее  на
целочисленных вычислениях,  чем  Pentium-100,  и  превосходит  на  обработке
числе с плавающей точкой, чем суперкомпьютерный набор микросхем R8000  фирмы
Mips. Топология процессора следующего поколения  21164А  не  изменилась,  но
она смаштабирована, кроме  того,  модернизирован  компилятор,  что  повысило
производительность на тестах SPECmarks. Предполагается, что готовые  образцы
нового процессора,  изготовленные  по  КМОП  -  технологии  с  нормами  0.35
микрон, при тактовой частоте свыше 300 МГц  будут  иметь  производительность
500 по SPECint92 и 700 по SPECfp92.
       Процессоры семейства 21164 на прибегают к преимуществам исполнения не
в  порядке  очередности  (out  –  of   –   order),   больше   полагаясь   на
интеллектуальные компиляторы, которые могут генерировать  коды,  сводящие  к
минимуму простои конвейера. Это самый  гигантский  процессор  в  мире  -  на
одном кристалле размещено 9.3 миллиона транзисторов, большая  часть  которых
пошла на ячейки кэш-памяти. Alpha  21164  имеет  на  кристалле  относительно
небольшую  первичную  кэш  прямого  отображения  на  8  Кбайт  и  96   Кбайт
вторичной. За счет вздувания площади  кристалла  достигнута  беспрецедентная
производительность кэширования.
       В 21164 работает четыре исполнительных блока (два для целых и два для
чисел с плавающей точкой) и может обрабатывать по две команды  каждого  типа
за такт. Он  имеет  четырехступенчатый  конвейер  команд,  который  "питает"
отдельные конвейеры для целых чисел, чисел с  плавающей  точкой  и  конвейер
памяти. По сравнению с прочими RISC-процессорами нового поколения чип  21164
имеет относительно глубокие и простые конвейеры, что позволяет запускать  их
с более высокой тактовой частотой.
       Конвейер команд вообще не заботится о их  зависимости  по  данным  (в
отличие от pentium Pro, который является ярким примером машины  данных),  он
выдает команды в порядке их поступления на свой вход (в  порядке  следования
по программе). Если текущие четыре команды невозможно послать сразу  все  на
различные исполнительные блоки, то конвейер команд  останавливается  до  тех
пор, пока это не станет возможным. В отличие от конкурентов 21164  также  не
использует технику переименования регистров, вместо нее  он  непосредственно
обновляет  содержимое  своих  архитектурных   регистров,   когда   результат
достигает  финальной  ступени  конвейера  –  write  –  back.  Для  борьбы  с
задержками  и  зависимостью  команд   по   данным   в   процессоре   активно
используются маршруты для обхода регистров, поэтому  совместно  используемые
операнды становятся доступными до стадии write - back.
       Компания Digital продвигает Альфу как платформу для серверов  Windows
NT, а не как традиционный UNIX-сервер.


                            4.7. Процессоры Mips.

       Mips процессор R1000 унаследовал свой суперскалярный дизайн от R8000,
который предназначался для рынка суперкомпьютеров  научного  назначения.  Но
R1000 ориентирован на массовые задачи. Использование в  R1000  динамического
планирования команд, которое ослабляет  зависимость  от  перекомпиляции  ПО,
написанного для более старых процессоров, стало возможным  благодаря  тесным
связям Mips со своим партнером Silicon Graphics, имеющим  богатейший  тыл  в
виде сложных графических приложений.
       R1000 первый однокристальный процессор от  Mips.  Для  предотвращения
остановок конвейера в нем использовано динамическое предсказание  переходов,
с четырьмя уровнями условного исполнения,  с  использованием  переименования
регистров, гарантирующего, что результаты не будут передаваться  в  реальные
регистры до тех пор, пока неясность по  команде  перехода  не  будет  снята.
Процессор  поддерживает  "теневую   карту"   отображения   своих   регистров
переименования. В случае неверного предсказания адреса  перехода  он  просто
восстанавливает эту карту отображения, но не выполняет  фактической  очистки
регистров и "промывки" буферов, экономя таким образом один такт.
       R1000 отличается также  радикальной  схемой  внеочередной  обработки.
Порядок следования команд в точном соответствии с программой сохраняется  на
трех первых ступенях конвейера, но затем поток разветвляется на три  очереди
(где команды дожидаются обработки на целочисленном АЛУ, блоке  вычислений  с
плавающей точкой и блоке загрузки/записи). Эти очереди уже обслуживаются  по
мере освобождения того или иного ресурса.
       Предполагаемая  производительность  R1000,  выполненного   по   КМОП-
технологии с нормами 0.35 микрон  должна  достичь  300  по  SPECint92  и  по
SPECfp92.
       Программный порядок в конце концов восстанавливается так,  что  самая
"старая" команда покидает обработку первой. Аппаратная поддержка  исполнения
в стиле out – of – order дает большие преимущества  конечному  пользователю,
так как коды, написанные под старые  скалярные  процессоры  Mips  (например,
R4000), начинают работать на полной скорости и  не  требуют  перекомпиляции.
Хотя потенциально процессор  R1000  способен  выдавать  по  пять  команд  на
исполнение в каждом такте,  он  выбирает  и  возвращает  только  четыре,  не
успевая закончить пятую в том же такте.
       Одно из двух устройств для вычисления двойной  точности  с  плавающей
точкой занято  сложениями,  а  другое  умножениями/делениями  и  извлечением
квадратного корня. Hа кристалле R1000  реализован  также  интерфейс  внешней
шины,  позволяющий  связывать  в  кластер   до   четырех   процессоров   без
дополнительной логики обрамления.


                      4.8. Процессоры Hewlett – Packard

       Hewlett – Packard  процессор  PA-8000.  Компания  Hewlett  –  Packard
одной из первых освоила RISC-технологию, выйдя еще  в  1986  году  со  своим
первым  32-разрядным  процессором  PA-RISC.  Практически   все   выпускаемые
процессоры PA-RISC используются в рабочих станциях HP серии 9000.  В  период
с 1991 по 1993 (перед  появлением  систем  на  базе  PowerPC)  HP  отгрузила
достаточно  много  таких  машин,  став  крупнейшим  продавцом  RISC-чипов  в
долларовом выражении.
       С целью пропаганды своих микропроцессоров среди других производителей
систем  компания  HP  стала   организатором   организации   Precision   RISC
Organization (PRO). А в 1994 году компания взорвала бомбу,  объединившись  с
Intel для создания новой архитектуры. Это  поставило  под  сомнение  будущее
PRO.
       PA-8000 это 64-разрядный, четырехканальный суперскалярный процессор с
радикальной  схемой  неупорядоченного   исполнения   программ.   В   составе
кристалла десять функциональных блоков, включая два целочисленных  АЛУ,  два
блока для сдвига целых чисел, два блока multiply/accumulate (MAC) для  чисел
с плавающей запятой, два  блока  деления/извлечения  квадратного  корня  для
чисел с плавающей запятой и  два  блока  загрузки/записи.  Блоки  МАС  имеют
трехтактовую  задержку  и  при  полной  загрузке  конвейера   на   обработке
одинарной точности обеспечивают производительность 4 FLOPS  за  такт.  Блоки
деления дают 17-тактовую задержку  и  не  конвейеризированы,  но  они  могут
работать одновременно с блоками МАС.
       В PA-8000 использован буфер переупорядочивания команд (IRB)  глубиной
56 команд, позволяющий "просматривать"  программу  на  следующие  56  команд
вперед в поисках таких четырех команд, которые можно выполнить  параллельно.
IRB фактически состоит из  двух  28-слотовых  буферов.  Буфер  АЛУ  содержит
команды для целочисленного блока и блока плавающей точки, а буфер  памяти  -
команды загрузки/записи.
       Как только команда попадает в слот IRB, аппаратура просматривает  все
команды, отправленные на функциональные блоки, чтобы найти среди них  такую,
которая является источником операндов  для  команды,  находящейся  в  слоте.
Команда в слоте запускается только после того,  как  будет  распределена  на
исполнение последняя команда, которая сдерживала ее. Каждый из  буферов  IRB
может выдавать по две команды в каждом такте,  и  в  любом  случае  выдается
самая   "старая"   команда   в   буфере.   Поскольку   PA-8000    использует
переименование регистров и возвращает результаты выполнения команд из IRB  в
порядке их следования по программе, тем самым поддерживается  точная  модель
обработки исключительных ситуаций.
       HP проектировала РА-8000 специально для задач коммерческой  обработки
данных и сложных вычислений, типа генной инженерии, в которых  объем  данных
настолько  велик,  что  они   не   умещаются   ни   в   один   из   мыслимых
внутрикристалльных  КЭШей.  Вот  почему,  РА-8000  полагается   на   внешние
первичные КЭШи команд и данных. Слоты в третьем 28-слотовом буфере,  который
называется буфером переупорядочивания адресов (Adress –  Recorder  Buffer  -
ARB), один к одному ассоциированы со слотами в  буфере  памяти  IRB.  В  АРВ
содержатся  виртуальные   и   физические   адреса   всех   выданных   команд
загрузки/записи. Кроме того, АРВ допускает выполнение загрузок и  записей  в
произвольном  порядке,  но  с  сохранением  согласованности  и  сглаживанием
влияния задержки, связанной с адресацией внешних КЭШей.


                          4.9. Процессоры Motorola.

       Motorola/IBM процессор PowerPC620 это  первая  64-битовая  реализация
архитектуры  PowerPC.  Имея  64-битовые  регистры  и  внутренние  магистрали
данных и семь миллионов  транзисторов,  новому  процессору  требуется  почти
вдвое больший и сложный кристалл,  чем  у  PowerPC  604.  Модель  620  имеет
четырехканальную   суперконвейерную   схему   с    шестью    исполнительными
устройствами:  три   целочисленных   АЛУ,   блок   плавающей   точки,   блок
загрузки/записи и блок переходов.  Последний  способен  на  четырехуровневое
предсказание ветвлений в программе и условное  исполнение  с  использованием
схемы переименования регистров.
       ПО микроархитектуре RISC-ядра 620-й похож на 604-й. Отличия  сводятся
в основном к ширине регистров и магистралей данных, а также  к  увеличенному
числу станций  резервирования  для  условного  исполнения  команд.  Прибавка
производительности  достигнута  за  счет  улучшенного  шинного   интерфейса.
Теперь он имеет 128-битовый интерфейс к памяти, по  которому  за  один  цикл
обращения можно выбрать два 64-битовых  длинных  слова,  и  40-битовая  шина
адреса, по которой можно адресовать до одного терабайта физической памяти.
       В  состав  шинного  интерфейса  входить  также  поддержка  кэш-памяти
второго уровня объемом до 128 Мбайт, которая  может  работать  на  четверти,
половине или на полной скорости ЦПУ.



         5. Лабораторные испытания и тестирование микропроцессоров.

               5.1. Лабораторные испытания процессоров i386DX.

       В 1992 году на рынке появилось  три  новых  МП,  способных  заместить
существующие 386DX и обеспечить повышение  характеристик  систем  на  основе
i386. Это: Intel RapidCAD, Chips& Technologies 38600DX, и  Cyrix  486DLC.  В
настоящий момент предлагаются  только  версии  33  МГц,  хотя  C&T  и  Cyrix
обещают выпустить в начале 1993 года  вариант  40  МГц.  Конечно,  на  такой
частоте можно заставить работать и 33 МГц вариант, но мой  опыт  показывает,
что это ненадежно, в любой момент машина  может  зависнуть.  Intel  RapidCAD
распространяется, как продукт для конечных пользователей, т.е. в машину  его
устанавливают именно они. Напротив, C&T и Cyrix поставляют  свои  процессоры
и  производителям.  Cyrix  также  производит  процессор  486SLC,  заменяющий
Intel/AMD 386SX. C&T объявил о создании процессора 38600SX, но в продаже  он
появится только в 1993 году, если вообще появится.
       RapidCAD,  грубо  говоря,  представляет  собой  процессор  486DX  без
внутренней кэш-памяти  и  с  цоколевкой  процессора  386.  Для  программ  он
соответствует 386 с сопроцессором, так  как  все  специфичные  команды  i486
удалены из набора команд.  Рекламируется  этот  процессор,  как  "абсолютный
сопроцессор" и, к чему и обязывает такое имя,  он  предназначен  для  замены
процессора   386DX   в   существующих   системах   и    резкого    повышения
производительности операций с плавающей точкой, таких, как CAD,  электронные
таблицы, математические  программные  пакеты  (SPSS,  Mathematica  и  т.д.).
RapidCAD состоит из двух корпусов; RapidCAD-1, в корпусе PGA  (132  вывода),
устанавливающийся в гнездо для i386, включает в себя ЦПУ и  модуль  операций
с  плавающей  точкой,  и   RapidCAD-2,   в   корпусе   PGA   (68   выводов),
устанавливающийся в гнездо для  сопроцессора  i387,  включает  в  себя  ПЛМ,
подающий сигнал на схемы системной платы  для  правильной  обработки  особых
ситуаций при операциях с плавающей точкой. Большинство операций  исполняется
в течение  одного  цикла,  как  и  в  i486.  Однако  узким  местом  является
интерфейс шины 386, так как каждый цикл шины равен двум  циклам  процессора.
Это значит, что команды выполняются  быстрее,  чем  считываются  из  памяти.
Поскольку операции с плавающей точкой выполняются медленнее обычных  команд,
то  замедление  на  них  не  сказывается,  и  они  выполняются  с  такой  же
скоростью, как и на  i486DX.  Именно  поэтому  RapidCAD  позволяет  получить
более высокие  характеристики  с  плавающей  точкой,  чем  любая  комбинация
386/387. Результаты теста SPEC,  стандартного  теста  для  машин  под  UNIX,
показывают, что RapidCAD ускоряет операции с плавающей точкой на  85%,  а  с
целыми числами - на  15%  по  сравнению  с  любой  комбинацией  386/387  при
одинаковой тактовой частоте. Потребляемая мощность  при  33  МГц  составляет
3500 мВт. Текущая цена RapidCAD 33 МГц составляет 300$.
       Предполагается, что процессор фирмы C&T 38600DX полностью совместим с
i386DX.  В  отличие  от  процессора  Am386  фирмы  AMD,  который  использует
микрокод, идентичный микрокоду Intel 386, в процессоре  38600DX  использован
патентно чистый микрокод,  для  обеспечения  полной  совместимости  в  набор
команд  даже  включена  недокументированная  команда  LOADALL386.  Некоторые
команды выполняются быстрее, чем  в  i386.  C&T  также  выпустила  процессор
38605DX, включающий кэш-память команд на 512 байт,  что  еще  более  повысит
его производительность. К сожалению, 38605DX выпускается в корпусе PGA  (144
вывода) и не может быть установлен  непосредственно  в  разъем  i386DX.  При
проведении испытаний я  заметил,  что  у  38600DX  есть  серьезные  проблемы
коммуникации  ЦПУ-  сопроцессор,  и  из-за  этого  скорость   выполнения   в
большинстве программ операций с плавающей точкой у него падает  ниже  уровня
i386/i387. Эта  проблема  существует  для  всех  производимых  на  настоящий
момент 387- совместимых сопроцессоров (ULSI 83C87, IIT  3C87,  Cyrix  EMX87,
Cyrix 83D87, Cyrix 387+, C&T 38700, Intel 387DX). Мой знакомый по сети  тоже
проводил такие тесты с 38700DX и пришел к аналогичным выводам.  Он  связался
с C&T, и ему ответили, что знают  об  этом.  Средняя  потребляемая  мощность
38600DX 40 МГц - 1650 Мвт, что меньше, чем потребление i386 33 МГц.  Текущая
цена 38600DX 33 МГц - 80$.
       Процессор Cyrix 486DLC  -  последняя  новинка  на  рынке  заменителей
i386DX. Набор его команд совместим с i486SX, установлена 1 КВ  кэш-память  и
аппаратно реализованный  16х16  бит  умножитель.  Исполнительное  устройство
486DLC, созданное  с  использованием  некоторых  принципов  RISC,  выполняет
большинство команд за  один  цикл.  Аппаратный  умножитель  перемножает  16-
разрядные значения за 3 цикла, вместо 12 - 25 циклов у i386DX. Это  особенно
удобно   при    вычислении    адресов    (код,    генерируемый    некоторыми
неоптимизирующими  компиляторами,  может  содержать  много  команд  MUL  для
доступа к массивам) и для программных вычислений с плавающей точкой  (напр.,
при  эмуляции  сопроцессора).  Внутренняя  кэш-память   представляет   собой
объединенную  память  команд  и  данных  сквозной  записи,  и   может   быть
конфигурирована, как память  с  прямым  отображением,  или  как  2-канальная
ассоциативная. Из-за необходимости обеспечения  полной  совместимости  после
перезагрузки процессора кэш-память отключается, и  должна  быть  включена  с
помощью небольшой программы, предоставляемой фирмой Cyrix.  Если  кэш-память
включена при загрузке, (напр., при "горячей"  перезагрузке,  Ctrl  –  Alt  –
Del) , BIOS моего РС (пр- ва AMI) зависает при загрузке,  и  мне  приходится
либо выполнять рестарт процессора, либо отключать кэш  перед  перезагрузкой.
Это  одна  из  причин  того,  что  после   запуска   процессора   кэш-память
отключается. Я уверен, что в следующих версиях  BIOS  фирмы  AMI  это  будет
учтено и встроенная кэш-память  будет  поддерживаться.  Кэш-память  помогает
процессору 486DLC преодолеть ограничения интерфейса шины 386,  хотя  процент
попаданий составляет не  более  50%.  Фирма  Cyrix  предусмотрела  некоторые
возможности управления кэш-памятью процессора, что, конечно,  улучшит  связь
внешней и внутренней кэш-памяти. Современные  системы  386  не  воспринимают
эти управляющие сигналы, не имеющие значения для  i386DX,  но  в  дальнейшем
системы,  разработанные   с   учетом   этих   возможностей   486DLC,   могут
использовать  их.  Встроенный  кэш  486DLC  допускает  до  4-х  некэшируемых
областей памяти, что может быть  очень  полезно  в  том  случае,  если  ваша
система использует периферийные устройства, отображаемые  в  память  (напр.,
сопроцессор Weitek). В существующих системах 386 пересылки DMA (напр.,  SCSI
контроллера, платы  звука)  могут  отключить  внутренний  кэш,  так  как  не
существует других способов обеспечить  соответствие  кэш-памяти  и  основной
памяти, что, конечно, снижает характеристики 486DLC.  Потребляемая  мощность
486DLC 40 МГц - 2800 Мвт. Немецкий дистрибьютор продает  486DLC  33  МГц  по
текущей цене 115$. 486DLC работает далеко не со всеми  сопроцессорами  и  не
во всех обстоятельствах, особенно критичен в  этом  отношении  многозадачный
защищенный режим (улучшенный режим MS- Windows).  При  использовании  486DLC
совместно с Cyrix EMC87, Cyrix 83D87 (выпуск до августа  1992)  и  IIT  3C87
машина зависает из-за проблем синхронизации между ЦПУ  и  сопроцессором  при
исполнении команд FSAVE и FRSTOR, сохраняющих и восстанавливающих  состояние
сопроцессора при переключении  задач.  Лучше  всего  использовать  486DLC  с
Cyrix 387+ (распространяется только в Европе) или Cyrix 83D87 выпуска  после
июля  1992,  являющийся  наиболее  мощным  сопроцессором  среди  совместимых
сопроцессоров 486DLC. Если у вас уже есть  сопроцессор  Cyrix  83D87,  и  вы
хотите знать, совместим ли он с  486LCD,  я  рекомендую  вам  мою  программу
COMPTEST,  распространяемую  как  CTEST257.ZIP  через   анонимные   ftp   из
garbo@uwasa.fi  или   другие   ftp-серверы.   Если   программа   сообщит   о
сопроцессоре 387+, то у вас установлен либо  387+,  либо  аналогичная  новая
версия 83D87 и проблем с совместимостью не будет.

При испытаниях использовалась система:
   Аппаратная конфигурация: 33,3/40 МГц системная плата, комплект микросхем
Forex, кэш  128  КВ  с  нулевым  состоянием  ожидания,  прямое  отображение,
сквозная запись, один буфер записи, 4 байта на строку, 4 цикла задержки  при
кэш-промахе. 8 МВ основной памяти, среднее  состояние  ожидания  1,6  цикла.
BIOS фирмы AMI. Процессор  Cyrix  EMC87  в  режиме  совместимости  387,  как
матсопроцессор. Этот процессор вместе с  Cyrix  83D87/387+  являются  самыми
быстрыми сопроцессорами для  работы  с  386DX/486DLC/38600DX.  Жесткий  диск
Conner 3204F, емкость 203  МВ,  интерфейс  IDE  (пропускная  способность  по
тесту CORETEST 1100 КВ/с, время поиска 16  мс).  Плата  SVGA  (ISA,  Diamond
SpeedSTAR HiColor), используется ET4000, 1  МВ  DRAM,  как  экранный  буфер,
графический ускоритель отключен.  Переключатели  на  видеоплате  установлены
для наиболее надежной с  быстрой  работы,  с  пропускной  способностью  6500
байт/мс при 40 МГц и 5400 байт/мс при 33 МГц.
    Программная конфигурация: MS-DOS 5.0, MS Windows 3.1, HyperDisk
4.32 в режиме обратной записи,  используется  2  МВ  расширенной  памяти,  в
качестве менеджера памяти используется  386MAX  6.01.  Эта  программа  также
обеспечивает DPMI в некоторых тестах.

Результаты тестов
       Для тестов Whetstone,  Drhystone,  WINTACH,  DODUC,  LINPACK,  LLL  и
Savage больший показатель означает большую производительность.
      Для тестов  MAKE  RTL,  MAKE  TRANK  и  теста  String-  Test  меньший
показатель означает большую производительность.

 33,3 МГц   Intel  C&T Intel Cyrix      Cyrix
                       386DX  38600DX RapidCAD 486DLC    486DLC
                                            кэш  выкл.  кэш  вкл.  Тесты   с
 целыми числами

 Whetstone (kWhet/s)   447   585  563   695   803
 Drhystone(C) (Dhry./s)      11688      11819 12357      14150 15488
 Drhystone(Pas) (Dhry./s)    10455      10877 10751      12154 13858
 String-Test (ms) 459  453   441  347   327
 MAKE RTL (s)     51,32      47,10      46,34 43,45      39,13
 MAKE TRANCK (s)  62,42      55,47      55,37 53,64      46,12
 WINTACH    4,85  4.90 5.49  5.53 6.14

 Тесты с плавающей запятой

 DODUC (Индекс скорости)     79.0 76.4  150.3 89.4 90.7
 LINPACK (Mflops) 0.2808     0.2707     0.4578     0.3158      0.3438
 LLL (Mflops)     0.3352     0.3537     0.6083     0.3816      0.4139
 Whetstone (kWhet/s)   2540  2340 3990  2908  3061
 Savage (решений/с)    71685 53191      72464 88757      93897

 40 МГц     Intel  C&T Intel Cyrix      Cyrix
                       386DX  38600DX RapidCAD 486DLC    486DLC
 Тесты с целыми числами      кэш выкл. кэш вкл.

 Whetstone (kWhet/s)   536   702  676   835   963
 Drhystone(C) (Dhry./s)      14128      14116 14836      16987 18750
 Drhystone(Pas) (Dhry./s)    12490      13067 12890      14573 16624
 String-Test (ms) 384  377   368  289   273
 MAKE RTL (s)     43.46      40.11      39.84 37.25      33.54
 MAKE TRANCK (s)  53.00      47.59      47.07 45.36      39.00
 WINTACH    5.65  5.73 6.41  6.46 7.23

 Тесты с плавающей запятой

 DODUC (Индекс скорости)     94.9 77.5  180.3 105.1      106.6
 LINPACK (Mflops) 0.3324     0.3260     0.5418     0.3789      0.4131
 LLL (Mflops)     0.4025     0.4204     0.7260     0.4562      0.4956
 Whetstone (kWhet/s)   3061  2632 4798  3505  3677
 Savage (решений/с)    86083 49587      86957 106762     112360
       Среди испытанных процессоров  Cyrix  486DLC  обладает  самой  большой
производительностью по целым числам.  С  включенной  внутренней  кэш-памятью
производительность по целым числам на одинаковой тактовой частоте 486DLC  на
80% превышает 386DX, среднее увеличение скорости работы прикладных  программ
составляет  35%.  При  работе  с  прикладными   программами,   использующими
операции как с целыми числами, так и  с  плавающей  точкой,  включенный  кэш
обеспечивает на 5% - 15% более высокие показатели  по  сравнению  с  работой
без КЭШа. Скорость  операций  с  плавающей  точкой  по  сравнению  с  i386DX
увеличивается на 15% - 30%
       Intel RapidCAD при работе вместо i386DX  обеспечивает  самые  высокие
характеристики  при  выполнении  операций  с  плавающей  точкой.  Прикладные
программы, выполняющие интенсивные операции  с  плавающей  точкой,  работают
быстрее на 60% - 90% по сравнению с i386DX/387DX,  отставая  от  i486DX  при
той же тактовой частоте по скорости операций с  плавающей  точкой  всего  на
25%. Скорость операций с целыми  числами  увеличивается  на  15%  -  35%  по
сравнению с i386DX/i387DX.
       Процессор Chips  &  Technologies  38600DX  обладает  несколько  более
высокими характеристиками при работе с целыми  числами,  чем  i386DX,  давая
среднее увеличение скорости порядка 10%.



     5.2. Результаты тестирования микропроцессоров с помощью пакета The
                                 Speed Test.

       Для  тестирования   различных   микропроцессоров   иногда   применяют
специальные пакеты программ processor benchmarks. Ниже приведены  результаты
тестирования  процессоров  с  помощью  пакета  программ  Speed   Test,   ARA
Copyright (C) 1994,95,96 Agababyan Robert Assotiation Used TMi0SDGL(tm)

  Pentium iP5-200(3-200), 512K PB         1318841
  Pentium iP5-200(2.5-200), 512K PB            1309353
  Pentium iP5-200(2.5-200)          1290780
  Pentium iP5-200(3-200)            1290780
  Pentium iP5-180, 512K PB          1181818
  Pentium iP5-180        1151899
  Pentium iP55-166, Intel Triton, IWill TSW2         1109756
  Pentium iP5-166, 512K PB          1096386
  Pentium iP5-166        1076923
  Pentium iP5-160, 512K PB          1052023
  Pentium iP5-160        1040000
  Pentium iP5-150, 512K PB          983784
  Pentium iP5-150        968085
  Pentium iP5-133, 512K PB          879227
  Pentium iP5-133        866667
  Pentium iP54-75(1.5-120), Intel Triton             812500
  Pentium iP54-75(2-120), Intel Triton         812500
  Pentium iP54-75(2-120), SiS 501/503          812500
  Pentium iP5-100(2-120), Intel Triton, ASUS P55-TP4        798246
  Pentium iP5-120(1.5-120), 512K PB     798246
  Pentium iP5-120, 512K PB   787879
  Pentium iP5-120(1.5-120)   781116
  Pentium iP5-120 777778
  Cx5x86-M1sc-100(3-150,Opt) 771186
  Cx5x86-M1sc-100(3-150,Opt) 758333
  Am5x86-133-X5-P75(4-200)   710938
  Pentium iP5-100, ALR Revolution  679104
  Pentium iP5-100, Intel Triton, ASUS P/I-P55TP4XE 669118
  Pentium iP5-100, Intel Triton    669118
  Pentium iP54-75(100), Intel Triton    669118
  Am5x86-133-X5-P75(3-180), UMC8886BF/8881F   640845
  Cx5x86-M1sc-100(3-120,Opt) 614865
  Pentium iP54-75(90), Intel Triton, ASUSTeK P54-TP4     606667
  Cx5x86-M1sc-100(3-120,Opt), SiS 471, GMB-486SG   600660
  Am5x86-133-X5-P75(4-160), SiS 471, BTC 4SLD5.1   568750
  Am5x86-133-X5-P75(4-160), SiS 496/7, ASUS PVI-SP3      568750
  Am5x86-133-X5-P75(4-160), SiS 471     561730
  Am5x86-133-X5-P75(4-160), SiS 496 PCI 561728
  Am5x86-133-X5-P75(4-160)   561128
  Cx5x86-M1sc-100(3-120), SiS 496/7, ASUS PVI-SP3  548193
  Cx5x86-M1sc-100(3-120,Opt), SiS 471, GMB-486SG   535294
  i80486DX4-100(120), UMC 8498F    535294
  Am5x86-133-X5-P75(3-150), SiS 471, BTC 4SLD5.1   529070
  Cx5x86-M1sc-100(Opt) 511236
  Nx586-90(100), NxVL System Logic, Alaris    505450
  Cx5x86-M1sc-100(Opt), SiS 471, GMB-486SG    501377
  Am5x86-133-X5-P75, SiS 471, BTC 4SLD5.1     469072
  Am5x86-133-X5-P75, SiS 496/7, ASUS PVI-SP3  469072
  Cx5x86-M1sc-100, SiS 496/7, ASUS PVI-SP3    455000
  i80486DX4-100, UMC 881     455000
  Nx586-90, NxVL System Logic, Alaris   455000
  Pentium iP5-60(66), PCI58PL      450495
  Pentium iP5-60(66), SiS 501/502/503, ASUS P5-SP  450495
  Cx5x86-M1sc-100, SiS 471, GMB-486SG   446078
  i80486DX2-66(4-100), PC Chips 18 446078
  i80486DX4-100, SiS 82C471, SOYO  446078
  OverDrive iDX4ODPR100 (486DX4-100)    437500
  i80486DX4-100, Compaq ProLinea 4/100  433333
  Am80486DX4-120SV8B, SiS 471, BTC 4SLD5.1    425234
  Am80486DX4-120, SiS 471, SOYO    425234
  Pentium iP5-60, Compaq DeskPro XL 560 406250
  Pentium iP5-60, Compaq Proliant  406250
  Pentium iP54-75(60), Intel Triton     406250
  Pentium iP5-60, OPTi 596/546/82, Bison III v1.0  406250
  Pentium iP5-60, SiS 501/502/503, ASUS P5-SP 406250
  Am80486DX2-80(100), UMC 8498F    352713
  Am80486DX4-100, PC Chips 18      350000
  Am80486DX2-80(100), SiS 471      345351
  Cx80486DX2-100, Opti VIP   344697
  i80486DX4-100(75), UMC 881 337037
  Pentium iP54-75(50), Intel Triton     334559
  Pentium iP54-75(45), Intel Triton     303333
  U5-S33(60), UMC 491F 301325
  i80486SX2-50(80), SiS 471, S486G 282609
  i80486DX2-S-80, PC Chips 18      280864
  i80486DX2-80, Symphony Haydn II  280864
  i80486DX2-S-80, UNICHIP U4800VLX, U486 WB   280864
  Cx80486DX2-66(80), OPTi 495SLC   277560
  U5-S33(50), SiS 471, AV7541      250000
  U5-S33(50), SiS 471, SOYO  250000
  U5-S33(50), UMC 491F 250000
  U5-S33F(50), UMC 8498F     250000
  U5-S33(50)      246612
  U5-S33(50), CONTAQ 82C596A, G486VLI   245946
  U5-S40(50)      245946
  i80486DX2-66, DELL   238196
  Am80486DX2-66, Forex 46C421      234964
  Am80486DX2-66, Bioteq 82C3491    234536
  Am80486DX2-66, OPTi 495SLC 234536
  i80486DX2-66 &E5, AcerMate 466   234536
  i80486DX2-66, ALI M1429/M1431    234536
  i80486DX2-66, SiS 82C471   234536
  i80486DX2-66, Symphony, Predator I    234536
  i80486DX2-66, OPTi 82C682, ALR Evolution 4  233333
  i80486DX2-66, PC Chips 11&13     233333
  Am80486DX2-66, IMS 8849    232143
  i80486DX2-66, Compaq ProLinea MT 4/66 232143
  Am80486DX2-66, UNICHIP U4800VLX, U486 WB    230964
  i80486DX2-66, Intel Champion     230964
  Cx80486DX2-66, UMC 82C491F 230964
  OverDrive iDX2ODPR66 (486DX2-66) 230964
  Am80486DX2-66, SiS 82C471  229798
  i80486DX2-66, Symphony Haydn II  229768
  i80486DX2-66, SiS 82C471   228643
  U5-S33(40), SiS 82C471     200441
  U5-S33F(40), UMC 8498F     200441
  U5-S33(40), Expert 4045    194861
  i80486DX-50, UMC 82C480    176357
  i80486DX2-50, Headland HT342/HT321    176357
  i80486SX-50, SiS 82C471    176357
  Am80486DX-50, UMC 82C491F  173004
  i80486DX-50     173004
  i80486DX2-50, OPTi 495SLC  171053
  Cx486S-40(50), UMC 82C491F 171053
  U5-S33, SiS 82C471   167279
  U5-S33, Expert 4045  162645
  IBM486SLC2-66, OPTi 495XLC 161922
  i80486SX-33(40), SiS 82C471      140867
  i80486SX-33(40), OPTi 82C495SLC  140867
  Am80486DX-40, OPTi 82C495SLC     140432
  i80486SX-33(40) &E5, Forex 521   140000
  i80486SX-33(40), Forex 521 139571
  Am80486DX-40, SiS 82C461   138931
  Cx486DX-40      135821
  Ti486DLC/E-40BGA, PC Chips, M321 126389
  Cx486DLC-40     126389
  Tx486DLC-40, OPTi 495SLC   126039
  Cx486DLC-40GP, SARC RC4018A4     123641
  IBM 486SLC2-50, WD7600     122642
  Cx486SLC-40, SARC RC2016A4, M396F     120053
  i80486SX-33, SiS 82C471    117571
  i80486DX-33, HP Vectra 486/33VL  116967
  i80486DX-33, OPTi 82C498, Simens-Nixdorf PCD-4H  116967
  i80486SX-20(33), Symphony  116967
  i80486DX-33, Intel Champion      116667
  i80486DX-33, Toshiba T9901C, LapTop   116667
  i80486DX-33, UMC 82C481    114035
  i80486SX-25, IBM PS/1             88694
  i80486SX-25, SiS            87838
  i80486SX-25, HiNT CS8005          87500
  i80486SX-25, HP Vectra 486SX/25VL            86502
  Am80386DX-40, ALI M1429/M1431           81835
  Am80386DX-40, CD-COM, M326        81835
  Am80386DX-40 WC, SARC             81835
  Am80386DX-40, UMC 82C491F         81688
  Am80386DX-40, OPTi 82C391         81531
  Am80386DX-40, UNICHIP U4800VXL          81182
  Am80386DX-40, PC Chips 5,6        80817
  Am80386DX-40, UMC 80C481          80647
  Am80386DX-40, OPTi 495XLC         80531
  Am80386DX-40, Forex FRX46C402,411            80247
  Am80386SX-40, P9 MXIC             73387
  i80386DX-33            68114
  Am80386SX-40, M396F         67407
  Am80386SX-40, Acer M1217          63459
  Am80386SX-40, ALI M1217           62329
  Am80386SX-40, PC Chips 2          61905
  i80386SX-33, Acer M1217           51066
  i80386SX-33            49296
  i80386DX-25            48925
  i80386SX-33, HP Vectra 386SX/33N        48611
  Am80386SX-33, Acer M1217          47744
  80286-25         45867
  80286-20         38625
  Harris 80286-20, UMC 82C208L            37387
  80286-16, HT12         29111
  i80286-12.5            24125
  i80286-12        22392
  i80286-10, IBM PS/2         15545
  i80286-10, IBM PS/2 60            15242
  i8088-9.54,     Commodore PC-20         5395
  i8088-7.16,     Commodore PC-20         4011
  i8088-4.77,     EC-1841           2968
  i8088-4.77,     Original XT             2697
  i8088-4.77,     Commodore PC-20         2658



                          6. Сравнительный анализ.

       В середины октября 1995 года в  г.  Сан-Хосе  (Калифорния)  состоялся
очередной Микропроцессорный Форум. В прошлом году на  нем  демонстрировались
прототипы процессоров IBM Power PC 620, MIPS R10000, SUN UltraSPARC, HP  PA-
8000 и DEC Alpha 21164.
       Из  прошлогодних  процессоров  –  дебиторов  до  рынка  дошел  только
процессор  Alpha  21164/300.  Его  производительность  по  тесту   SPECint92
составила 341 единицу. Пребывая с такой  потрясающей  производительностью  в
лидерах гонки на  быстродействие  процессоров,  в  ноябре  Alpha  пропустила
вперед  компанию  Intel  с  процессором  Pentium  Pro.  Страсти   накалились
нешуточные и  вот  на  нынешнем  форуме  Digital  сообщила,  что  в  декабре
приступит к выпуску нового  варианта  этого  процессора  -  Alpha  21164A  с
тактовой частой 333 МГц, выполненного по технологии 0.35 мкм.  Проектируемая
производительность 500 по SPECint92.
       Hewlett – Packard анонсировала 32-разрядный процессор архитектуры  РА
следующего поколения РА-7300LC с встроенными функциями  мультимедиа.  Hачало
его выпуска по 0.5 мкм технологии возможно  во  второй  половине  следующего
года. Этот первый процессор PA-RISC, оснащенный внутренними 64 Кбайт  КЭШами
первого уровня для команд и для  данных,  предпочтительно  будет  иметь  200
SPECint92 и 275 SPECfp92.
       Через  год  после  объявления  процессора  UltraSPARC   фирма   SPARC
Technology представила новый проект UltraSPARC- II.  Hовый  процессор  будет
иметь 5.4 млн. транзисторов, изготавливаться по технологии
0.35 микрон, работать на частоте 250-300 МГц.  Проектируемое  быстродействие
250 МГц версии -  350  SPECint92  и  550  SPEFfp92.  Кроме  базовой  системы
команд,  процессор  будет  оснащен  набором  из  30  новых   команд   Visual
Instruction Set, которые предназначены для быстрой обработки  видеофайлов  в
формате MPEG-2, рендеринга трехмерных оболочек, видеоконференцсвязи.
       Рождение  Pentium  Pro  восхитительная  новость,  но  оно   неизменно
поднимает несколько серьезных вопросов.  Hа  самом  ли  деле  это  полностью
новое поколение  процессора  Pentium?  Побила  ли  Intel  своих  конкурентов
окончательно? Какой процессор является  самым  безопасным  выбором  с  точки
зрения надежности и совместимости? Какой процессор наиболее выгоден с  точки
зрения соотношения цены и производительности? Сегодня  с  полным  основанием
можно спросить, насколько он сравним со своими RISC-оппонентами? Hе  устарел
ли лозунг Apple о том, что Power Mac перспективнее, чем линия x86?
       Hа все вопросы можно ответить в принципе утвердительно. Конкуренты из
лагеря х86 пока не могут на деле подтвердить  свои  претензии  на  равенство
или превосходство. Hичего живого или приличного (Cyrix) на руках  пока  нет.
А ценовой ориентир Intel известен:  настольный  high  –  end   компьютер  на
платформе Aurora, Pentium Pro 150 MHz, ОЗУ 16 Мб, жесткий диск EIDE 1 Гб,  2
Мб SVGA, монитор 17" NI digital SVGA, Windows 95 в декабре обойдется  жадным
к мощности пользователям дешевле $5000. Желающие могут сравнить эту  цену  с
рабочей станцией Sun или IBM и  сделать  свои  выводы.  Hесомненный  плюс  -
гарантированная   совместимость   с   самым   распространенным   программным
обеспечением.  Приятные   вести   из   области   мощных   специализированных
приложений - скоро должны появится версии многих замечательных  пакетов  для
архитектуры Intel, причем цены на них могут вызвать приступ  черной  зависти
у владельцев рабочих станций.
       Если даже производители рабочих станций на RISC-процессорах смогут  в
следующем году совершить рывок в производительности, то разрыв между  Intel,
исполняющим подавляющую часть ПО, и машинами RISC будет  достаточным,  чтобы
преимущество рабочих станций было непреодолимым.
       В первом номере Computer Week Moscow можно найти  пассаж  интересного
характера. Дословно: "Опытные системы P6 способны  на  большее,  чем  просто
выдерживать конкуренцию со стороны других рабочих станций  среднего  класса.
При непосредственном сопоставлении рабочих  станций  Intergraph  на  200-МГц
процессоре Pentium  Pro  и  Silicon  Graphics  Indigo-2  Extreme  с  200-МГц
процессором Mips R4400, последняя  на  тестах  iSPEC  показала  порядка  160
единиц,  тогда  как  оценки  Intel  для  системы  P6   полной   конфигурации
соответствуют 366 единицам."
       При создании процессора Pentium Pro делался упор на способности  этой
микросхемы выполнять графический рендеринг и работать с 32-разрядным кодом.
       Pentium  Pro  явно  выламывается  из  рамок  процессора   Pentium   и
принадлежит шестому поколению архитектуры Intel x86. Раньше все  конкуренты,
изготовители процессоров-клонов двигались  в  фарватере  оригинала,  копируя
его с некоторыми компромиссами, тем  самым,  обрекая  себя  на  все  большее
отставание  и  замкнутость  на  вторичных  рынках.  Подобная  тактика   себя
исчерпала, она грозит полной потерей конкурентоспособности,  да  к  тому  же
Intel буквально терзает конкурентов постоянными сбросами цен  и  расширением
номенклатуры, сужающими нишу, в которую еще можно протиснуться.
       Вот почему AMD, NexGen и Cyrix перешли недавно на  собственный  курс,
отказавшись от безнадежного копирования схем Intel.
       Hо  принципиальной  прорасти  между  конкурентами  нет.  В  некоторых
случаях Pentium Pro более сложен, чем Nx586, K5 и  M1,  в  других  менее.  В
целом же схема P6 сравнима с прочими процессорами;  наиболее  близок  к  ней
дизайн К5, как считают эксперты.
       Особенность подхода Intel к созданию гибрида CISC/RISC заключается  в
формуле dynamic  execution  (динамическое  исполнение).  Примерно  такие  же
базовые  принципы  вы  обнаружите,  если  станете  разбираться  подробно   с
архитектурой последних RISC-процессоров IBM/Motorola PowerPC 604 и Power  PC
620, Sum UltraSparc, Mips R10000, Digital Alpha 21164 и HP PA-8000.
       Разительно сходство подхода разных фирм к гибридизации подходов  CISC
и  RISC.  Внешне  Pentim   Pro   выглядит   традиционным   CISC-процессором,
совместимым со  всем  наработанным  программно-аппаратным  фондом.  Знакомый
"фасад" прикрывает от пользователя RISC-подобное  ядро.  Между  "фасадом"  и
"задними  комнатами"  работает  умнейший  декодер,  разбивающий  сложные   и
длинные команды х86 на более простые операции, похожие  на  команды  RISC  -
компания Intel называет их u-ops или micro - ops. Эти micro - ops  поступают
в  ядро  процессора,  которое  их  буквально  перелопачивает.   Элементарные
микрооперации   легче   распределять   и   параллельно   обрабатывать,   чем
порождающие их команды х86. Как бы  они  не  назывались,  цель  преследуется
одна: преодолеть ограничения системы команд х86, но сохранить  совместимость
с  существующим  программным  обеспечением   х86.   Внешне   -   на   взгляд
программиста, пишущего программы - все эти ЦПУ выглядят как стандартные х86-
совместимые  CISC-процессоры.  А  внутри  они  работают  как  современнейшие
модели RISC-чипов.
       Hо сегодня Pentium Pro "живее" и быстрее не только любого из  "живых"
процессоров архитектуры х86, включая Nx586  и  Cyrix6x86,  но  и  любого  из
выпускаемых RISC-процессоров.
       Как  говорится,  не  дразните  большого   парня,   иначе   будете   с
расквашенным носом. Именно таков смысл послания Intel в  адрес  конкурентов:
NexGen, Cyrix и AMD.


                               7. Pentium II.
                               7.1 Pentium II
       Выпущенный  с  середины  1997  года,  Pentium  II  ввел  ряд  больших
изменений в мир процессоров PC.

       Во-первых,  чип  и  системный  кэш  второго  уровня  соединялись   по
выделенной шине, способной работать на частоте шины процессор-система.

       Во вторых, процессор, вторичный кэш и тепло отвод  были  смонтированы
на небольшой плате, вставлявшейся в разъем на системной  плате,  что  больше
напоминало карту расширения, чем традиционную схему процессор/гнездо.  Intel
окрестил это Single Edge Contact cartridge (SEC) -  односторонне  контактный
картридж. В этом картридже находятся шесть отдельных компонент -  процессор,
четыре индустриально стандартных burst-static-cache  RAM  и  один  tag  RAM.
Дизайн SEC картриджа наделял важными преимуществами. PGA-компоновка  Pentium
Pro требовала 387 контактов, в то  время  как  SEC-картридж  -  только  242.
Уменьшение на треть числа контактов произошло благодаря наличию в  картридже
дискретных элементов, таких как замыкающие  резисторы  и  конденсаторы.  Эти
элементы обеспечивают  расщепление  сигналов,  что  значит  намного  меньшее
число  требуемых  разъемов  питания.  Разъем  SEC-картриджа  использует  так
называемый Slot 1 и воспринимается  как  принимающий  эстафету  у  уходящего
Socket 7.

       Третье изменение - в большем синтезе, так как Pentium  II  объединяет
Dual Independent Bus (DIB) от Pentium Pro c технологией MMX от Pentium  MMX,
формируя новый вид - гибрид Pentium Pro/MMX.  Таким  образом,  внешне  очень
отличный от предыдущих интеловских процессоров, Pentium II внутренне  являет
собой смесь новых технологий и улучшений старых чипов.

       И наконец, в отличие от Pentium Pro, работающего на 3.3v, Pentium  II
питается от 2.8v,  позволяя  Intel  пускать  его  на  больших  частотах  без
чрезмерного увеличения  требование  к  мощности.  В  то  время,  как  200MHz
Pentium Pro с 512kb кэша потребляет 37.9 ватт, 266MHz  Pentium  II  с  512kb
кэша сжигает 37.0 ватт.

       Подобно Pentium Pro,  Pentium  II  применяет  интеловскую  Технологию
Динамического  Исполнения.  Когда  программная  инструкция   считывается   в
процессор  и  декодируется,  она  попадает  в  исполняемый  пул.  Технология
Динамического  Исполнения  принимает  три  основных  подхода  к  оптимизации
способа обращения процессора с кодом. Множественные  Предсказания  Ветвлений
проверяют программный поток вдоль нескольких ветвей и предсказывают,  где  в
памяти находится следующая инструкция.

       Когда процессор читает, он также  проверяет  следующие  инструкции  в
потоке,  ускоряя  в  результате  рабочее  течение.  Анализ   Потока   Данных
оптимизирует последовательность, в  которой  инструкции  будут  выполняться,
проверяя декодированные инструкции и определяя, готовы ли они для  обработки
или зависят  от  других  инструкций.  Спекулятивное  Выполнение  увеличивает
скорость  таких  инструкций  просмотром  вперед  от  текущей  инструкции   и
обработкой дальнейших инструкций, которые вероятно  могут  понадобится.  Эти
результаты  хранятся  как  спекулятивные  до  тех  пор,  пока  процессор  не
определит, какие  ему  нужны,  а  какие  -  нет.  С  этой  точки  инструкция
возвращается в нормальную очередь и добавляется к потоку.

       У Технологии Динамического Исполнения есть два основных преимущества:
Инструкции обрабатываются быстрее и эффективнее, чем обычно,  и,  в  отличие
от CPU с применением RISC архитектуры, программы не  надо  перекомпилировать
для извлечения выгод процессора. Процессор все делает на лету.

       Значительной новой особенностью является удаление вторичного кэша  из
собственно  процессора  на  отдельную  кремниевую  пластину   в   картридже.
Процессор  читает  и  пишет  данные  в  кэше  используя   специализированную
высокоскоростную шину. Называемая задней (backside) шиной, она  отделена  от
системной шины  процессор-память  (сейчас  называемой  передней  (frontside)
шиной). Процессор может использовать обе шины одновременно,  но  архитектура
двойной независимой шины имеет другие преимущества.

       Хотя  шина  между  процессором  и  кэшем  второго   уровня   работает
медленнее, чем на обычном Pentium Pro  (на  половине  скорости  процессора),
она чрезвычайно масштабируема.  Чем  быстрее  процессор,  тем  быстрее  кэш,
независимо от 66MHz  передней  шины.  Вдобавок,  передняя  шина  может  быть
увеличена с 66 до 100MHz без влияния на  шину  кэша  второго  уровня.  Также
очевидно, что наличие памяти на  одном  кристалле  с  процессором  негативно
сказывается на проценте выхода годных 512kb Pentium Pro,  сохраняя  высокими
цены.

Pentium II опирается на GTL+ (gunning-transceiver-logic)  логику  хост-шины,
допускающую естественную поддержку двух процессоров.  Во  время  выхода  это
обеспечивало   стоимостно   эффективное   минималистское    двухпроцессорное
решение,    допускаемое    симметричной     мультипроцессорностью     (SMP).
Двухпроцессорное ограничение налагалось не самим Pentium  II,  а  поддержкой
чипсета.  Изначальное  ограничение  чипсета  двухпроцессорной  конфигурацией
позволяло Intel и поставщикам рабочих  станций  предлагать  двухпроцессорные
системы как временное и экономичное  решение,  что  по  другому  и  не  было
возможно. Это ограничение было снято с середины 1998 года с выходом  чипсета
450NX, поддерживающего от  одного  до  четырех  процессоров.  Чипсет  440FX,
содержащий чипы PMC и DBX, не допускал  чередования  (interleaving)  памяти,
но  поддерживал  EDO  DRAM,  позволяя  улучшать  производительность   памяти
уменьшением ожидания.

       Когда Intel проектировал Pentium II, он также взялся  за  слабую  16-
битную  производительность  его  предшественника.   Pentium   Pro   роскошно
работает с полностью  32-битным  обеспечением,  таким  как  Windows  NT,  но
опускается ниже  стандартного  Pentium'а,  обрабатывая  16-битный  код.  Это
влечет худшую чем Pentium производительность под Windows 95,  большие  части
которой пока 16-битны. Intel решил эту проблему  использованием  пентиумного
кэша с дескрипторами сегментов в Pentium II.

Как и Pentium Pro, Pentium II чрезвычайно быстр в арифметике плавающей
точки. В сочетании с Accelerated Graphics Port (AGP) это делает Pentium II
мощным решением для высокопроизводительной 3D графики.


                                7.2 Deschutes
333MHz воплощение Pentium II под кодовым названием Deschutes (по реке,
текущей в Орегоне), было анонсировано в начале 1998 года с планируемыми в
течение года 400MHz и выше. Имя Deschutes в действительности относится к
двум разным линиям CPU.
Версия для Slot 1 - ничего более, чем слегка эволюционировавший Pentium II.
Архитектура и физический дизайн идентичны, за исключением того, что
Deschutes Slot 1 частью сделан с использованием 0.25-микронной технологии,
введенной осенью 1997 года с ноутбучным процессором Tillamook, по сравнению
с 233-300MHz версиями, выполненными по 0.35-микронному процессу. Применение
0.25-микрон означает, что транзисторы на матрице физически ближе между
собой и CPU потребляет меньше энергии, а следовательно рассеивает меньше
тепла на данной частоте, позволяя ядру тикать на больших частотах.
       Все  иное  у  Slot  1  Deschutes  идентично  обычному   Pentium   II.
Смонтированный на основание и заключенный в SEC  картридж,  он  поддерживает
набор инструкций MMX и  общается  с  512kb  вторичного  кэша  на  половинной
частоте ядра. Он имеет тот же конечный  коннектор,  и  работает  на  тех  же
системных платах с теми же чипсетами. Как таковой он работает  с  440FX  или
440LX на внешней частоте 66MHz.

С весны 1998 года большой шаг в производительности пришел со следующим
воплощением Deschutes, когда вышел новый чипсет 440BX, допускающий 100MHz
передачу по системной шине, уменьшая закупоривание данных и поддерживая
частоты от 350 до 400MHz.
       Другой процессор, зовущийся Deschutes, относится к Slot 2, выпущен  с
середины 1998 года как Pentium II  Xeon.  Intel  разбил  Slot  1  и  Slot  2
Deschutes на взаимодополняющие товарные линии, где Slot 1  предназначен  для
массового производства, а Slot 2 нацелен на high-end  серверы  и  туда,  где
цена вторична по отношению к производительности.



                          7.3 Мобильный Pentium II
      Естественное продвижение маломощного (в смысле энерго
потребления/рассеивания) семейства Pentium II Deschutes на рынок
портативных PC осуществилось с выпуском линейки мобильных Pentium II в
апреле 1998 года. Новый процессор и его компаньон мобильный 440BX чипсет,
изначально были доступны в 233 и 266MHz вариантах, скомпонованные в
существующий мобильный модуль (MMO) или новый мини-картридж формат. Intel
ожидает к концу 1998 года более половины из снаряженных его мобильными
процессорами PC будут уже Pentium II, а срок мобильных Pentium II Tillamook
окончится к середине 1999 года.


                                 7.4 Celeron
       В попытке лучшего удовлетворения сектора дешевых  PC,  до  настоящего
времени вотчины производителей клонов, AMD и Cyrix,  продолжающих  развивать
унаследованную архитектуру Socket 7, Intel  выпустил  свой  ряд  процессоров
Celeron в апреле 1998 года.

Основанный на той же P6 архитектуре, что и Pentium II, и используя тот же
0.25-микронный процесс, Celeron-системы предлагают полный комплект
последних технологий, включая поддержку AGP графики, ATA-33 жестких дисков,
SDRAM и ACPI. Celeron будет работать на любом интеловском Pentium II
чипсете, поддерживающим 66MHz системной шины, включая 440LX, 440BX и новый
440EX, специально спроектированный для рынка 'базовых' PC. В отличие от
Pentium II с его SEC картриджем, Celeron не имеет защитного пластикого
покрытия вокруг карт процессора, что Intel называет Single Edge Processor
Package (SEPP). Он полностью совместим со Slot1, что позволяет использовать
существующие платы, но механизм крепления для карты CPU не адаптирован для
форм фактора SEPP.
    Первые 266 и 300MHz Celeron'ы без кэша второго уровня встретили мало
    энтузиазма на рынке, не неся или неся мало преимуществ над системами-
 клонами Socket 7. В августе 1998 года Intel пополнил ряд Celeron семейством
    процессором, названных Mendocino. Снабженный 128kb вторичного кэа на
    матрице, работающего на полной частоте процессора, и соединяясь через
  внешнюю 66MHz шину, новый Celeron стал намного более живым, чем его вялый
   предшественник. Отчасти путано, две доступные версии получили названия
     Celeron 333 и 300a. Первый является основной версией, совместимый с
 существующей интеловской архитектурой, в то время как второй патентует Pin
 370 socket, отличный от Socket 7 и Socket 1, нацеленный на дешевые low-end
                                   машины.

                             7.5  Pentium “Xeon”
C  начала  июля  1998  года  по  всему  миру  проходила  серия  мероприятий,
посвящённых  представлению  самого  мощного   процессора   архитектуры   х86
корпорации Intel. Задолго до этого из информации, размещённой на  Web-сайтах
Intel стало известно его название и назначение.  Особо  подчёркивалось,  что
слово Xeon нежно произносить как  «Зеон»,  но  российское  представительство
приняло решение  подчинить  это  название  нормам  русского  (и  греческого)
языка. Так что в России мы будем иметь дело с «Ксеоном»,-  ведь  есть  же  у
нас Ван Клиберн и Мехико.
    Новый процессор, к слову,  стал  подарком  компании-производителя  самой
себе по случаю тридцатилетия.
   Первое, что бросается в глаза, - необычно  крупный  размер  процессорного
картриджа в  который  «пакуется»  Xeon.  Он  предназначен  для  установки  в
разъём  новой конструкции Slot 2. По словам разработчиков,  это  связанно  с
увеличением  ёмкости  кэш-памяти  второго   уровня.   В   настоящий   момент
процессоры Xeon с единой тактовой частотой поставляются в двух вариантах:  с
512 Кбайт и 1 Мбайт КЭШа L2. Но  уже  в  текущем  году  планируется  довести
ёмкость кэш-памяти второго уровня до 2 Мбайт и повысить тактовую частоту  до
450 МГц. Напомню, что старый Pentium II комплектовался лишь 512 Кбайт.
    Но ещё больший  интерес  вызывает  тот  факт,  что  конструкторы  смогли
«заставить»  L2-кэш  работать  на  тактовой  частоте   процессорного   ядра.
Напомню, что та же концепция была реализована в Pentium  Pro,  но  при  этом
разработчики «столкнулись»  на  стадии  производства  (процент  выхода  двух
качественных  кристаллов  оказался  ниже   предполагаемого),   и   процессор
оказался довольно дорогим. Возможно, именно поэтому  Pentium  II  изначально
создавался  с  «разделением»  кристаллов  (основного  и  КЭШа  L2),  за  что
пришлось расплачиваться  «половиной»  тактовой  частоты  кэш-памяти  второго
уровня.
     Высокая  частота  работы  КЭШа  спровоцировала  увеличение  теплоотдачи
процессорного   блока,   поэтому   потребовалось   использование   массивной
поглощающей тепло пластины, что, в свою очередь, привело к  увеличению  веса
и габаритов модуля.
    В каждом модуле Slot 2 три специальных области данных: доступная  только
для  чтения,  область  для  чтения/записи  и   динамическая  информация   о 
температуре внутри процессорного модуля. В  области  первого  типа  помещена
информация о  версии  процессора,  данные  о  пошаговой  отладке  и  указана
предельно допустимая температура.  Во  второю  область  памяти  пользователи
могут вводить свою информацию.
Доступ к динамическим  данным  об  изменении  температуры  даёт  возможность
управляющим программам оповещать администратора  об
опасных системных событиях.
    Увеличение ёмкости КЭШа второго уровня повышает  пропускную  способность
системы благодаря  мгновенному  доступу  процессоров  к  часто  используемым
данным и инструкциям, хранящимся в быстрой кэш-памяти. По  заявлению  Intel,
увеличение ёмкости КЭШа с 512 Кбайт до 1 Мбайт приводит иногда к  20%  росту
общей производительности системы.
Для объяснения этого явления уместно  провести  аналогию  с  холодильниками,
используемую Intel: хранение запаса продуктов в
холодильнике  избавляет  поваров  ресторана  от  необходимости   ездить   по
магазинам, закупая провизию. Чем больше холодильник, тем лучше,
особенно в час пик, когда количество клиентов в ресторане резко  возрастает.
Так вот, в случае с сервером «холодильник» - это кэш-память второго  уровня,
а «магазин» (где доступны те же  продукты)  -  в  принципе  более  медленная
системная память.
Большой   кэш   L2    значительно    повышает    общую    производительность
многопроцессорных конфигураций в системах, работающих с  крупными  массивами
несопоставимых данных. По информации Intel,  проведённые  корпорацией  тесты
ZD ServerBench показали почти
пропорциональный  рост  производительности   системы   по   мере   установки
дополнительных процессоров с мегабайтным КЭШем.
      Усовершенствованная   архитектура   Xeon,   допускающая   36-разрядную
адресацию физической  памяти,  теоретически  позволяет  процессору  получать
доступ  к  системной  памяти  ёмкостью   до   64   Гбайт.   Новый   механизм
постраничного  обмена  Page  Size  Extension  -  36  останется   практически
незаметной для глаз пользователя и  разработчиков  приложений.  В  настоящее
время PSE-36 поддерживают операционные системы Windows NT,  SCO  UnixWare  и
Sun Solaris. Для остальных операционных систем потребуется обновить  драйвер
блока управления памятью.
    Intel 450NX PCIset стал первым микросхемным   набором,  оптимизированным
для Pentium II  Xeon.  Он  выпускается  в  двух  вариантах,  Basic  и  Full,
соответственно для серверных hi-end и  систем  среднего  уровня.  Они  имеют
одинаковую структуру ядра, но отличаются производительностью и ценой.
    Basic PCIset поддерживает до двух разъёмов 32-разрядной PCI, один -  64-
разрядной и до 4 Гбайт системной памяти типа EDO. Его более
совершенный «родственник» Full PCIset поддерживает до  четырёх  слотов  типа
EDO. Эти чипсеты объединяет функционирование на
100-мегагерцовой   частоте   системной   шины   и   возможность    поддержки
многопроцессорных (до четырёх Xeon) конфигураций. 64-разрядная
шина PCI способна существенным  образом  повысить  общую  производительность
системы с  учётом  оптоволоконной  технологии  обмена  данными  с  дисковыми
массивами,  использования  высокопроизводительных  сетевых  магистралей   на
основе АТМ, Gigabit Ethernet и других. Повышается,  по  сути,  синхронизация
мощности процессора и производительности подсистемы ввода-вывода.
    Xeon, как я уже отмечал, предназначен не только для серверов, но  и  для
рабочих и графических станций, для которых одним из важнейших
параметров является производительность видеоподсистемы. Для  них  разработан
чипсет Intel 440GX AGPset на базе  известного  микросхемного  набора  440BX.
440GX  управляет  работой  порта  AGP   в   режиме   2х.   Режим   удвоенной
производительности реализуется благодаря так называемой  технологии  двойной
накачки - данные передаются как по  переднему,  так  и  по  заднему  фронтам
тактовых импульсов (у обычной AGP - только по переднему),  при  этом  полоса
пропускания достигает значения 533 Мбайт/с. Физические параметры  интерфейса
AGP остаются прежними.
    Ещё одой особенностью набора чипсета  440GX стала возможность  обращения
к памяти ёмкостью до 2 Гбайт, что в два раза больше, чем у
его приемника.
      Несмотря   на   тот   факт,   что   в   настоящий    момент    понятие
многопроцессорности ассоциируется у Intel лишь с  четырьмя  устройствами  на
одной плате, ведутся  работы  по  созданию  симметричных  мультипроцессорных
систем, поддерживающих  до  восьми  «Ксеонов».  Разработки  восьмиканального
чипсета для Xeon ведутся фирмой  Corollary,  дочерней  компанией  Intel.  И,
само собой, возможны  кластерные  решения,  скажем,  на  основе  архитектуры
распределённой памяти (NUMA). В обоих случаях,  как  правило,  не  требуется
«переписывать» прикладные программы (правда,  операционная  система  требует
некоторой оптимизации). В  процессорной  шине  чипсета  Intel  450NX  PCIset
предусмотрен так называемый  разъём  кластерного  соединения,  что  упрощает
построение кластерного соединения на основе стандартных  четырёхпроцессорных
узлов.
    Ещё  одним  перспективным  направлением  является  кластер  с  передачей
сообщений. Суть  её  состоит  в  отсутствии  разделения  ресурсов.  Отдельно
стоящие узлы кластера обмениваются данными, например, тактовыми  импульсами,
сигнализирующими о  нормальном  состоянии  системы.  И  хотя  LAN-соединение
остаётся работоспособным, существует необходимость в сети нового типа -  так
называемой SAN (System  area Network).

     В  завершении  хотел  бы  отметить,  что  некоторые  ведущие   западные
производители (IBM, NCR, Dell) уже начали поставки систем на базе
Xeon, а на презентации процессора в России компании Kraftway и «Вист»  также
представили свои новые серверные решения.
       Ориентировочные цены на Pentium Xeon составят 1124 долларов  (L2  512
Кбайт) и 2836 долларов (L2 1 Мбайт) при поставках от тысячи штук.



                             Список литературы:

               Д-р Джон Гудмен "Управление памятью для всех",
                           Диалектика, Киев, 1996

             В.Л. Григорьев "Микропроцессор i486. Архитектура и
                  программирование", Гранал, Москва, 1993.


               Информационно - рекламная газета "КМ - информ"

                        газета "Компьютер World/Киев"

                       газета "Компьютер Week/Moscow"

        Ж.К. Голенкова и др. "Руководство по архитектуре IBM PC AT",
                             Консул, Минск, 1993


             Руководство программиста по процессору Intel i386,
             Техническая документация уровня 2, (C) Intel Corp.

             Руководство программиста по процессору Intel i486,
             Техническая документация уровня 2, (C) Intel Corp.

         Материалы эхоконференции SU.HARDW.PC.CPU компьютерной сети
                                   FidoNet



смотреть на рефераты похожие на "Процессоры "