Программирование и комп-ры

Микропроцессоры


                                 Содержание


1.    Введение в персональный компьютер.     2

2.    Отличия процессоров.   3
  2.1. Отличия процессоров SX, DX, SX2, DX2 и DX4.  3
  2.2. Обозначение «SL-Enhanced» y пpоцессоpов Intel 486.      4
  2.3. Отличия пpоцессоpов UMC 486 U5 от Intel, AMD и дpугих.  4
  2.4. Чипы RISC и CISC.     4
  2.5.  Перемаркированные процессоры.   4

3.    Процессоры фирмы Intel.     5
  3.1. Современная микропроцессорная технология фирмы Intel.   5
  3.2. Первые процессоры фирмы Intel.   5
  3.3. Процессор 8086/88.    6
  3.4. Процессор 80186/88.   6
  3.5. Процессор 80286.      6
  3.6. Процессор 80386.      6
  3.7. Процессор 80486.      8
  3.8. Intel OverDrive процессор.  8
  3.9. Процессор Pentium.    9
  3.10.     Процессор Pentium Pro. 13

4.    Процессоры конкурентов Intel.     16
  4.1.      Первые процессоры конкурентов Intel.   16
  4.2.      Процессоры фирмы AMD. 17
  4.3.      Процессоры NexGen.    20
  4.4.      Процессоры Cyrix.     21
  4.5.      Процессоры Sun Microsystems.     21
  4.6.      Процессоры Digital Equipment.    22
  4.7.      Процессоры Mips.      23
  4.8.      Процессоры Hewlett-Packard. 24
  4.9.      Процессоры Motorola.  25

6. Сравнительный анализ.     25

1.    Введение в персональный компьютер.



      Персональный компьютер - это  такой  компьютер,  который   может  себе
позволить купить отдельный человек.


      Наиболее «весомой» частью любого компьютера  является  системный  блок
(иногда его называют  компьютером,  что   является   недопустимой  ошибкой).
Внутри него расположены блок  питания,  плата   с   центральным  процессором
(ЦП),  видеоадаптер,  жесткий   диск,   дисководы  гибких  дисков  и  другие
устройства ввода / вывода информации.  Зачастую видеоадаптер  и  контроллеры
ввода/ вывода  размещены  прямо  на  плате  ЦП.  В  системном  блоке   могут
размещаться  средства   мультимедиа:  звуковая  плата  и  устройство  чтения
оптических дисков -  CD-ROM.   Кроме  того,  в  понятие  «компьютер»  входит
клавиатура и монитор.  Манипулятор мышь является необязательной,  но  весьма
важной   деталью.   Теперь  коротко  о  выборе  основных  компонентов    ПК.
Процессор  является  основным  компонентом  любого  ПК.  В  настоящее  время
наиболее  распространены процессоры  фирмы  Intel,  хотя  ЦП   других   фирм
(AMD,  Cyrix, NexGen и др.) составляют  им  достойную  конкуренцию.  Имеется
также   материнская   (MotherBoard)    плата.    Основной    характеристикой
материнских плат является их  архитектура.  Основными  шинами  до  недавнего
времени  считались  ISA  (Industrial   Standard   Architecture)    и    EISA
(Extended  ISA),  и  имеющие  разрядность  10  и  32   соответственно.   Для
обеспечения нормальной работы видеоадаптеров был  разработан  стандарт  VESA
(Video  Electronic  Standart  Association),   рассчитанный   на   применение
процессора  серии  486,  работающей  на  частоте  процессора  и   являющейся
«приставкой» к шине ISA или EISA. С появлением   процессора   Pentium   была
разработана  самостоятельная  шина  PCI,  которая   на   сегодняшний    день
является  наиболее  быстрой  и  перспективной.  Обычно  в  ПК   присутствует
дисковод для гибких дисков. Существует два стандарта :  5.25»  и  3.5».   На
сегодняшний день большинство компьютеров поставляется  с   дисководом  3.5».
Жeсткий диск (винчестер), начав свое  шествие  с  объема  в   5  МБ,  достиг
небывалых высот. На  сегодняшний  день  не  удивят  диски объемом  2  или  4
ГБ. Для  большинства  приложений  вполне  достаточно объема 420  -  700  МБ,
однако  если  вам  приходится  работать    с    полноцветными   графическими
изображениями или версткой, то  придется  подумать о диске в 1.5- 2  ГБ  или
даже паре таких  дисков.   Следует   при-дать  значение  не  только  емкости
диска, но и его  временным  характеристикам. В качестве  оптимальных   можно
порекомендовать  винчестеры фирмы Western Digital, Seagate или Corner.   Для
 оперативной  памяти (RAM, ОЗУ) закон простой:  чем  больше,  тем  лучше.  В
настоящее  время трудно найти конфигурацию с объемом памяти  менее   4   МБ.
Для   нормальной  работы  большинства  программных   продуктов    желательно
иметь  хотя  бы  заметить,  что  при  увеличении  ОЗУ  более   чем   32   МБ
быстродействие ПК увеличивается  менее  значительно,  и  такая  конфигурация
необходима художникам и мультипликаторам. Hеотъемлемой  частью  ПК  является
клавиатура. Стандартной в России  является  101  -  клавишная  клавиатуры  с
английскими  и  русскими  символами.  Мышь.   Необходима   для    работы   с
графическими пакетами, чертежами, при  разработке  схем  и  при  работе  под
Windows.  Следует  отметить  ,  что  некоторое   игровое    и    программное
обеспечение требует наличие мыши. Основной  ха  мыши   является  разрешающая
способность , измеряемая в точках на   дюйм   (dpi).   Нормальной  считается
мышь,  обеспечивающая  разрешение  300-400   dpi.    Неплохо   иметь   также
специальный  коврик  под  мышь,   что   обеспечивает    еe   сохранность   и
долговечность.  Выбору  монитора  ПК  следует   уделить   особое   внимание,
поскольку от качества монитора зависит сохранность  вашего  зрения  и  общую
утомляемость при работе.  Мониторы  имеют  стандартный  размер  диагонали  в
14,15,17,19,20  и  21  дюйм.    Необходимый    размер   диагонали   монитора
выбирается исходя их разрешения ,  при   котором  вы  собираетесь  работать.
Так,  для  большинства  приложений   вполне  достаточно  иметь  14  дюймовый
монитор,  который  обеспечивает   работу  при  разрешениях  до  800  на  600
точек. ПК может иметь звуковую  карту.  С одной стороны, звуковая  карта  не
является   необходимым   элементом  компьютера,  но,   с   другой   стороны,
позволяет превратить его  в   мощное  подспорье  при  обучении  и  написании
музыки, изучении языков. Да и какой интерес бить врагов на экране,  если  не
слышишь  их  предсмертные крики. Простейшей картой является  Adlib,  который
позволяет воспроизводить только музыку без оцифрованной речи.  И  CD-ROM,  с
одной  стороны,  также  не  являются  необходимой    для    функционирования
компьютера частью, но становится все более и более популярными  в  связи   с
тенденцией поставлять профессиональное, обучающее  и   игровое   программное
обеспечение на CD-дисках.


                         2.    Отличия процессоров.



              2.1.  Отличия процессоров SX, DX, SX2, DX2 и DX4.



      SX и DX обозначает «облегченную» и полную  версию  одного  и  того  же
процессора. Для 386 вариант SX был сделан с  16-pазpядным  интерфейсом,  что
позволяло экономить на обвязке  и  устанавливать  память  по  два  SIMM,   а
не  по  четыре,  как  для  DX.  Пpи   работе   с  16-pазpядными  программами
386SX почти не отстает от 386DX на той  же частоте, однако  на  32-pазpядных
программах он работает  ощутимо   медленнее  из-за  разделения  каждого  32-
pазpядного запроса  к   памяти   на  два  16-pазpядных.  Hа  самом  же  деле
большинство компьютеров  с  386DX работают быстрее компьютеров с SX даже  на
16-pазpядных программах  - благодаря тому, что на платах с 386DX чаще  всего
установлен  аппаpатный  кэш,  котоpого  нет  на  большинстве  плат   с   SX.
Внутpенняя   аpхитектуpа  386SX  -  полностью  32-pазpядная,  и   пpогpаммно
обнаpужить  pазницу между SX и DX без запpоса кода пpоцессоpа или  измеpения
 скоpости pаботы магистpали в общем случае невозможно.


      Для 486 SX обозначает ваpиант без встpоенного   сопpоцессоpа.   Ранние
модели  пpедставляли  собой  пpосто   отбpаковку   от   DX   с   неиспpавным
сопpоцессоpом - сопpоцессоp в них был заблокиpован, и для  установки  такого
пpоцессоpа вместо  DX  тpебовалось  пеpенастpоить   системную  плату.  Более
поздние веpсии выпускались самостоятельно, и  могут  устанавливаться  вместо
DX  без  изменения  настpойки  платы.   Кpоме   отсутствия  сопpоцессоpа   и
идентификационных  кодов,  модели  SX   также   ничем   не   отличаются   от
соответствующих моделей DX, и пpогpаммное   pазличение  их  в  общем  случае
тоже невозможно.


      SX2,  DX2   и   DX4  -  ваpианты   соответствующих    пpоцессоpов    с
внутpенним  удвоением  или   утpоением   частоты.    Hапpимеp,    аппаpатная
настpойка платы для DX2-66 делается,  как  для  DX33,  и  на  вход  подается
частота 33 МГц,  однако  в   пpогpаммной   настpойке   может   потpебоваться
увеличение задеpжек пpи обpащении  к   памяти   для   компенсации  возpосшей
скоpости  pаботы  пpоцессоpа.  Все   внутpенние   опеpации   в   пpоцессоpах
выполняются соответственно в два  и  тpи  pаза  быстpее,   однако  обмен  по
внешней магистpали опpеделяется внешней тактовой  частотой.  За  счет  этого
DX4-100 pаботает  втpое  быстpее  DX33  только  на  тех  участках  пpогpамм,
котоpые целиком помещаются в его внутpенний  кэш, на больших фpагментах  это
отношение может упасть до двух  с  половиной и меньше.


      Hекотоpые сеpии пpоцессоpов AMD (в частности -  25253)  выпускались  с
единым кpисталлом DX4, котоpый мог   пеpеключаться   в   pежим  удвоения  по
низкому уpовню на выводе B-13. Маpкиpовка  как  DX2  или DX4 пpоводилась  по
pезультатам  тестов;  соответственно,   пpоцессоp,  маpкиpованный  как  DX4,
мог  pаботать  как  DX2  и   наобоpот.   Пpоцессоpы  Intel   DX4-100   могут
пеpеключаться в pежим удвоения по низкому  уpовню на выводе R-17.


      Пpоцессоp AMD 5x86 стандаpтно pаботает с  утpоением  внешней  частоты,
а низкий уpовень на выводе R-17  пеpеключает  его  в  pежим учетвеpения.



          2.2.  Обозначение «SL-Enhanced» y пpоцессоpов Intel 486.



      Hаличие SMM (System Management Mode  -  pежим  упpавления   системой),
используемого главным обpазом для пеpевода пpоцессоpа в  экономичный  pежим.
Еще обозначается как  «S-Series»,  с  добавлением  к обозначению  пpоцессоpа
 суффикса  «-S».  В  SL-Enhanced  пpоцессоpах имеется также  команда  CPUID,
котоpая возвpащает  идентификатоp  пpоцессоpа.



        2.3.  Отличия пpоцессоpов UMC 486 U5 от Intel, AMD и дpугих.



      Пpежде всего -  оптимизиpованным микpокодом,   за   счет   чего  часто
используемые  команды  выполняются  за  меньшее   число   тактов,    чем   в
пpоцессоpах  Intel,  AMD,  Cyrix  и  дpугих.   Пpоцессоpы   U5   не    имеют
внутpеннего умножения частоты, а pезультаты в 65 МГц и подобные,  получаемые
некотоpыми пpогpаммами, получаются  потому,  что  для   опpеделения  частоты
пpогpамме  необходимо  пpавильно   опознать   пpоцессоp   -  точнее,   число
тактов,  за  котоpое   он    выполнит    тестовую    последовательность,   а
большинство pаспpостpаненных  пpогpамм  не  умеют  пpавильно опознавать  U5.
 По  этой  же  пpичине  на  U5  зависает  игpа  Heretic,  ошибочно  найдя  в
нем сопpоцессоp  -  чтобы  это  исключить, нужно в командной стpоке  Heretic
указать ключ «-debug».


                           2.4.  Чипы RISC и CISC.



      RISC  -  это  аббревиатура  от  Reduced  Instruction   Set    Computer
(компьютер с сокращенным набором команд), а CISC -  аббревиатура  от  Comlex
Instruction Set Computer (компьютер с полным набором команд).   Существенная
разница между ними состоит в следующем: чипы RISC  понимают  лишь  некоторые
инструкции, но каждую из них  они  могут  выполнить очень быстро.  Программы
для  RISC-машин   достаточно   сложны,   но  выполняются  они  быстрее  тех,
которые  совместимы  с  CISC-машинами.  Hо,  может  быть,  это  и  не   так?
(Исследования  производительности  еще  не завершены.)


      Все   чипы   Intel   80x86   (как   и    чипы      Motorola      680x0
(68010,68020,..,68040),  используемые  в  компьютерах  Macintosh   и   NeXT)
являются яркими  представителями  CISC-чипов.  Hекоторые  рабочие   станции,
начиная с IBM, используют чипы RISC.



                     2.5.  Перемаркированные процессоры.



      Перемаркированные процессоры (remaked CPUs) - это  процессоры, которые
разгоняют сильнее чем оригинальные для более высокой  цены  и  прибыли.  Эти
действия   считаются   незаконными.   Использование    такого   ЦПУ   всегда
рискованно. Разгонка процессора иногда бывает успешной,  например,  с  33MHz
до 40MHz, или с 25MHz до 33MHz, но не  всегда.   Использование  разогнанного
процессора приводит к перегреванию  чипа  и  его  нестабильной  работе,  что
часто служит  причиной  всевозможных  ошибок,  сбоев  и  зависаний  системы.
Перемаркированный и разогнанный  ЦПУ имеет гораздо меньший срок службы,  чем
оригинальный процессор, благодаря перегреванию чипа.


                        3.    Процессоры фирмы Intel.



         3.1.  Современная микропроцессорная технология фирмы Intel.



      Достижения фирмы Intel в  искусстве  проектирования   и   производства
полупроводников делают возможным производить мощные  микропроцессоры  в  все
более малых  корпусах.  Разработчики   микропроцессоров  в  настоящее  время
работают   с   комплементарным   технологическим     процесом    метал-оксид
полупроводник (CMOS) с разрешением менее, чем микрон.


      Использование субмикронной технологии позволяет   разработчикам  фирмы
Intel располагать больше транзисторов  на  каждой   подложке.   Это  сделало
возможным  увеличение   количества   транзисторов   для   семейства  X86  от
29,000 в 8086 процессоре до 1,2  миллионов  в  процессоре  Intel486  DX2,  с
наивысшим достижением в Pentium  процессоре.  Выполненный по  0.8  микронной
BiCMOS технологии,  он  содержит   3.1   миллиона  транзисторов.  Технология
BiCMOS объединяет  преимущества  двух технологий:  биполярной  (скорость)  и
CMOS (  малое   энергопотребление  ).  С  помощью  более,  чем  в  два  раза
большего  количества   транзисторов  Pentium  процессора  по   сравнению   с
Intel486,    разработчики    поместили   на   подложке   компоненты,   ранее
располагавшимися    снаружи    процессора.    Наличие   компонентов   внутри
уменьшает время доступа, что   существенно  увеличивает  производительность.
0.8 микронная технология фирмы Intel использует трехслойный металл и   имеет
 уровень,   более   высокий   по  сравнению  с  оригинальной  1.0  микронной
технологией двухслойного  металла, используемой в процессоре Intel486.


                    3.2.  Первые процессоры фирмы Intel.



      За  20-летнюю  историю  развития  микропроцессорной  техники   ведущие
позиции в  этой  области  занимает   американская   фирма   Intel  (INTegral
ELectronics). До того как  фирма  Intel  начала  выпускать  микрокомпьютеры,
она  разрабатывала  и  производила  другие  виды   интегральных   микросхем.
Главной ее продукцией были микросхемы  для  калькуляторов.  В  1971  г.  она
разработала и выпустила первый в мире  4-бит-ный микропроцессор 4004.  Фирма
первоначально продавала его  в   качестве  встроенного  контроллера  (что-то
вроде средства управления   уличным  светофором  или  микроволновой  печью).
4004  был  четырехбитовым, т.е. он мог хранить, обрабатывать и записывать  в
память   или   считывать  из  нее  четырехбитовые  числа.  После  чипа  4004
появился 4040,  но 4040 поддерживал  внешние  прерывания.  Оба  чипа   имели
фиксированное  число  внутренних  индексных  регистров.  Это  означало,  что
выполняемые программы были ограничены числом вложений подпрограмм до 7.


      В 1972 г., т.е. спустя год после  появления  4004,   Intel   выпустила
очередной процессор   8008,   но   подлинный   успех   ей   принес  8-битный
микропроцессор 8080, который был объявлен в  1973  г.   Этот  микропроцессор
получил очень широкое  распространение  во   всем   мире.   Сейчас  в  нашей
стране  его  аналог  -  микропроцессор   KP580ИК80   применяется  во  многих
бытовых персональных  компьютерах  и  разнообразных  контроллерах.  С  чипом
8080  также  связано  появление  стека   внешней   памяти,   что   позволило
использовать программы любой вложенности.


      Процессор 8080 был основной частью  первого   небольшого   компьютера,
который получил широкое  распространение  в   деловом   мире.   Операционная
система для него была создана фирмой Digital Research и  называлась  Control
Program for Microcomputers (CP/M).



                          3.3.  Процессор 8086/88.



      В 1979 г. фирма  Intel  первой  выпустила   16-битный   микропроцессор
8086,  возможности  которого  были   близки   к   возможностям   процессоров
миникомпьютеров 70-х  годов.  Микропроцессор  8086  оказался  «прародителем»
целого семейства, которое называют семейством  80x86  или х86.


      Hесколько   позже   появился   микропроцессор    8088,    архитектурно
повторяющий микропроцессор 8086 и имеющий 16-битный   внутренние   регистры,
но  его  внешняя  шина  данных  составляет  8  бит.   Широкой   популярности
микропроцессора способствовало его применение  фирмой  IBM   в  персональных
компьютерах PC и PC/XT.



                          3.4.  Процессор 80186/88.



      В 1981  г. появились  микропроцессоры  80186/80188,  которые сохраняли
базовую архитектуру микропроцессоров 8086/8088, но  содержали  на  кристалле
контроллер  прямого  доступа  к   памяти,    счетчик/таймер   и   контроллер
прерываний. Кроме того,  была  несколько  расширена система  команд.  Однако
широкого  распространения   эти    микропроцессоры   (как   и   персональные
компьютеры PCjr на их основе), не получили.



                           3.5.  Процессор 80286.



      Следующим крупным шагом в разработке новых  идей  стал  микропроцессор
80286, появившийся в 1982 году. При разработке  были   учтены  достижения  в
архитектуре  микрокомпьютеров  и   больших   компьютеров.   Процессор  80286
может работать в двух режимах:  в  режиме   реального  адреса  он  эмулирует
микропроцессор 8086, а в защищенном режиме  виртуального  адреса  (Protected
Virtual Adress Mode) или  P-режиме  предоставляет программисту  много  новых
возможностей  и  средств.  Среди них можно  отметить  расширенное   адресное
  пространство   памяти   16  Мбайт,  появление  дескрипторов  сегментов   и
дескрипторных  таблиц,   наличие  защиты  по  четырем  уровням   привилегий,
поддержку  организации  виртуальной  памяти  и  мультизадачности.  Процессор
80286 применяется в ПК PC/AT и младших моделях PS/2.



                           3.6.  Процессор 80386.



      При разработке 32-битного процессора 80386  потребовалось  решить  две
основные задачи - совместимость и производительность.  Первая  из  них  была
решена с помощью эмуляции микропроцессора  8086  -  режим  реального  адреса
(Real Adress Mode) или R-режим.


      В Р-режиме процессор 80386 может выполнять  16-битные  программы (код)
процессора 80286 без каких-либо дополнительных модификаций. Вместе с тем,  в
этом же режиме он может выполнять свои  «естественные» 32-битные  программы,
что  обеспечивает  повышение   производительности  системы.  Именно  в  этом
режиме реализуются все  новые   возможности  и  средства  процессора  80386,
среди которых  можно  отметить масштабированную индексную адресацию  памяти,
ортогональное использование  регистров  общего  назначения,  новые  команды,
средства  отладки.  Адресное пространство памяти в этом режиме составляет  4
Гбайт.


      Микропроцессор 80386 дает разработчику систем большое  число  новых  и
эффективных возможностей, включая  производительность  от  3  до  4  миллион
операций в секунду, полную 32-битную архитектуру,  4   гигабитное  (2  байт)
физическое  адресное  пространство  и  внутреннее   обеспечение  работы   со
страничной виртуальной памятью.


      Несмотря на введение в него последних   достижений   микропроцессорной
техники, 80386 сохраняет совместимость по  объектному   коду  с  программным
обеспечением, в большом количестве  написанным  для   его  предшественников,
8086 и 80286. Особый   интерес   представляет   такое  свойство  80386,  как
виртуальная машина, которое  позволяет  80386   переключаться  в  выполнении
программ, управляемых различными операционными системами, например, UNIX   и
  MS-DOS.   Это   свойство   позволяет  производителям  оригинальных  систем
непосредственно вводить  прикладное программное  обеспечение  для  16-битных
машин в  системе  на  базе 32-битных микропроцессоров. Операционная  система
P-режима  может  создавать  задачу,  которая   может   работать   в   режиме
виртуального  процессора 8086 (Virtual 8086 Mode)  или  V-режим.  Прикладная
программа, которая выполняется в этом режиме, полагает, что она работает  на
 процессоре 8086.


      32-битная  архитектура  80386   обеспечивает   программные    ресурсы,
необходимые для поддержки  «больших  «  систем,  характеризуемых  операциями
с большими числами, большими структурами данных,  большими программами  (или
большим числом программ) и т.п.   Физическое   адресное  пространство  80386
состоит из 2 байт  или  4  гбайт;   его   логическое  адресное  пространство
состоит  из  2  байт  или  64   терабайт  (тбайт).  Восемь  32-битных  общих
регистров 80386 могут быть взаимозаменяемо использованы как операнды  команд
и как переменные  различных способов адресации. Типы данных включают в  себя
8-, 16- или  32-бит-ные целые  и  порядковые,  упакованные  и  неупакованные
десятичные,  указатели,  строки  бит,  байтов,   слов   и   двойных    слов.
Микропроцессор 80386 имеет полную систему  команд  для  операций  над  этими
типами  данных,  а  также  для  управления  выполнением  программ.   Способы
адресации 80386 обеспечивают  эффективный  доступ  к  элементам  стандартных
структур данных: массивов, записей, массивов записей и записей,   содержащих
массивы.


      Микропроцессор 80386 реализован с помощью  технологии  фирмы Intel  CH
MOSIII - технологического  процесса,   объединяющего   в   себе  возможности
высокого быстродействия технологии HMOS  с  малым   потреблением  технологии
кмоп. Использование геометрии 1,5  мкм  и  слоев   металлизации  дает  80386
более 275000 транзисторов на  кристалле.  Сейчас  выпускаются  оба  варианта
80386, работающих на частоте  I2  и  I6 мгц без состояний  ожидания,  причем
вариант 80386 на 16 мгц обеспечивает скорость работы 3-4  миллиона  операций
в секунду.


      Микропроцессор 80386 разделен внутри  на  6  автономно  и  параллельно
работающих блоков с соответствующей  синхронизацией.  Все  внутренние  шины,
соединяющие эти блоки, имеют разрядность  32  бит.  Конвейерная  организация
функциональных блоков в 80386   допускает   временное  наложение  выполнения
различных  стадий  команды  и  позволяет  одновременно  выполнять  несколько
операций.  Кроме  конвейерной  обработки всех  команд,  в  80386  выполнение
ряда важных операций  осуществляется специальными аппаратными  узлами.  Блок
умножения/деления 80386  может выполнять 32-битное умножение  за  9-41  такт
синхронизации, в  зависимости от числа значащих цифр; он может разделить 32-
битные  операнды за 38 тактов (в случае чисел без знаков) или  за  43  такта
(в  случае чисел со знаками). Регистр группового сдвига   80386   может   за
один такт сдвигать от 1 до 64 бит. Обращение к более медленной  памяти  (или
к  устройствам   ввода/вывода)   может   производиться   с    использованием
конвейерного формирования адреса для  увеличения  времени  установки  данных
после адреса до 3 тактов при сохранении двухтактных  циклов   в  процессоре.
Вследствие внутреннего  конвейерного  формирования   адреса  при  исполнении
команды,  80386,  как  правило,  вычисляет  адрес  и   определяет  следующий
магистральный  цикл  во   время   текущего    магистрального   цикла.   Узел
конвейерного формирования адреса  передает  эту   опережающую  информацию  в
подсистему памяти, позволяя, тем  самым,  одному банку памяти  дешифрировать
следующий магистральный цикл, в то   время  как  другой  банк  реагирует  на
текущий магистральный цикл.



                           3.7.  Процессор 80486.



      В 1989 г. Intel  представила  первого  представителя  семейства 80х86,
содержащего более миллиона транзисторов в чипе. Этот чип во многом сходен  с
80386. Он на 100% программно совместим с   микропроцессорами  386(ТМ)  DX  &
SX.  Один  миллион  транзисторов   объединенной   кэш-памяти   (сверхбыстрой
оперативной памяти),  вместе   с   аппаратурой  для  выполнения  операций  с
плавающей запятой и управлением памяти  на одной микросхеме,  тем  не  менее
поддерживают  программную  совместимость  с  предыдущими  членами  семейства
процессоров  архитектуры  86. Часто  используемые  операции  выполняются  за
один   цикл,    что    сравнимо   со   скоростью   выполнения   RISC-команд.
Восьмикилобайтный унифицированный кэш  для  кода  и  данных,  соединенный  с
шиной пакетного обмена данными со скоростью  80/106  Мбайт/сек  при  частоте
25/33  МГерц   гарантируют  высокую  производительность  системы   даже    с
недорогими  дисками (DRAM).  Новые  возможности  расширяют   многозадачность
систем.  Новые операции увеличивают скорость работы с семафорами  в  памяти.
Оборудование  на  микросхеме  гарантирует  непротиворечивость  кэш-памяти  и
поддерживает   средства   для   реализации   многоуровневого    кэширования.
Встроенная  система  тестирования  проверяет   микросхемную    логику,  кэш-
память  и  микросхемное   постраничное   преобразование   адресов    памяти.
Возможности отладки  включают   в   себя   установку   ловушек   контрольных
точек в выполненяемом коде и при доступе к  данным.   Процессор  i486  имеет
встроенный в микросхему  внутренний  кэш   для   хранения  8Кбайт  команд  и
данных. Кэш  увеличивает  быстродействие  системы,   отвечая  на  внутренние
запросы чтения быстрее, чем при выполнении  цикла чтения оперативной  памяти
по шине. Это средство  уменьшает  также  использование  процессором  внешней
шины. Внутренний кэш  прозрачен  для  работающих  программ.  Процессор  i486
может использовать  внешний  кэш второго уровня вне  микросхемы  процессора.
Обычно внешний кэш  позволяет увеличить быстродействие  и  уменьшить  полосу
пропускания  шины, требуемую процессором i486.



                      3.8.  Intel OverDrive процессор.



      Возможность постоянного совершенствования.  Пользователи  персональных
компьютеров  все  чаще  сталкиваются  с  этим  по  мере  все    возрастающих
требований к микропроцессорам   со   стороны   аппаратного   и  программного
обеспечения. Фирма Intel  уверена:  лучшая  стратегия   совершенствования  -
первоначально заложенная в систему  возможность  модернизации,  модернизации
согласно вашим нуждам. Впервые в  мире  такая  возможность   предоставляется
нашим  потребителям.  Фирма  Intel  приступила  к  выпуску  Intel  OverDrive
процессора,  открывающего   новую  категорию  мощных  сопроцессоров.   После
простой установки  этого  сопроцессора  на  плату  резко  вырастет  скорость
работы  всей  системы  и  прикладных  программ  в  MS-DOS,  Windows,   OS/2,
Windows'95 и UNIX.


      С помощью этой одной-единственной  микросхемы  Вы  сразу   же  сможете
воспользоваться преимуществами новой стратегии фирмы   Intel,  заложенной  в
нашей  продукции.  Когда   настанет    неотвратимый    момент,   когда   Вам
потребуется производительность большая, чем у Вашего   компьютера,  то  все,
что Вам будет нужно - это вставить  OverDrive  процессор в Вашу систему -  и
пользоваться  преимуществами,  которые   даст  Вам  новая  микропроцессорная
технология фирмы Intel. Более чем  просто модернизация, OverDrive  процессор
- это  стратегия  защиты  Ваших настоящих и будущих вкладов  в  персональные
компьютеры.


      Intel OverDrive процессор гарантирует Вам   отвечающую   стандартам  и
экономичную   модернизацию.   Всего   лишь    одна    микросхема    увеличит
вычислительную мощь Вашего компьютера  до  требований  самого   современного
программного обеспечения и даже тех программ, которые  еще  не  написаны,  в
MS-DOS, в Windows, в PS/2, в UNIX, от  AutoCAD  -  до WordPerfect.


      Итак,  наш  первый  микропроцессор  в  серии  Single   Chip    Upgrade
(Качественное улучшение - одной микросхемой) - это OverDrive процессор   для
 систем  на   основе   Intel     i486SX.     Установленный     в  OverDrive-
разъем, этот  процессор  позволяет  системе  i486SX   использовать  новейшую
технологию «удвоения скорости», используемую в процессоре i486DX2, и  дающую
общее увеличение  производительности   до   70%.   OverDrive  процессор  для
систем  i486SX  содержит  модуль   операций   над  целыми  числами,   модуль
операций над числами с плавающей точкой,  модуль  управления  памятью  и  8К
кэш-памяти  на  одном  кристалле,  работающем  на  частоте,   в   два   раза
превышающей  тактовую  частоту   системной  шины.  Это  уникальное  свойство
позволяет Вам  удвоить  тактовую   частоту  Вашей  системы,  не  тратясь  на
покупку и установку других  дополнительных компонентов. OverDrive  процессор
удвоит, например,  внутреннюю частоту МП i486SX 25 МГц до 50 МГц.


      Хотя Intel OverDrive  -  это совершенно новая технология  качественной
модернизации, в нем узнаются  и  фамильные  черты  Intel.   Изготовленный  и
испытанный  в   соответствии   с   жесткими   стандартами  Intel,  OverDrive
отличается зарекомендовавшими себя свойствами  продукции Intel: качеством  и
надежностью.  OverDrive  обеспечен   постоянной   гарантией   и    привычным
сервисом  и  поддержкой  во   всем   мире.   OverDrive  полностью  совместим
более чем с 50000 прикладных программ.  OverDrive  процессор  для  i486SX  -
только первый из наших  новых  процессоров. Во втором  полугодии  1992  года
мы  выпустим   OverDrive   процессор  для  систем  i486DX2,  самих  по  себе
представляющих  новое   поколение  технологии  МП.   Мощный   и   доступный,
OverDrive процессор  проложит для Вас непрерывный путь к  качественно  новым
уровням  производительности персональных компьютеров.


                          3.9.  Процессор Pentium.



      В то время, когда Винод Дэм делал первые наброски,  начав  в июне 1989
года разработку Pentium процессора, он  и  не  подозревал, что  именно  этот
продукт будет  одним  из   главных   достижений   фирмы  Intel.  Как  только
выполнялся очередной этап проекта, сразу  начинался  процесс  всеобъемлющего
тестирования. Для  тестирования  была  разработана  специальная  технология,
позволившая   имитировать     функционирование    Pentium    процессора    с
использованием  программируемых  устройств,  объединенных  на  14  платах  с
помощью кабелей. Только когда были обнаружены  все  ошибки,  процессор  смог
работать в реальной системе. В дополнение ко всему, в процессе разработки  и
тестирования Pentium процессора  принимали  активное  участие  все  основные
разработчики   персональных  компьютеров  и  программного  обеспечения,  что
немало  способствовало общему успеху проекта. В конце 1991 года, когда  была
завершен макет процессора, инженеры смогли запустить  на   нем   программное
обеспечение. Проектировщики  начали  изучать  под  микроскопом   разводку  и
прохождение  сигналов  по  подложке  с  целью  оптимизации    топологии    и
повышения эффективности работы. Проектирование в основном   было   завершено
в феврале 1992  года.  Началось  всеобъемлющее  тестирование опытной  партии
процессоров, в течение которого испытаниям  подвергались все блоки  и  узлы.
В апреле 1992 года было принято решение,   что  пора  начинать  промышленное
освоение Pentium процессора.  В  качестве основной  промышленной  базы  была
выбрана  5  Орегонская  фабрика.   Более  3  миллионов   транзисторов   были
окончательно   перенесены   на   шаблоны.   Началось  промышленное  освоение
производства  и  доводка  технических характеристик, завершившиеся через  10
месяцев, 22  марта  1993  года широкой презентацией Pentium процессора.


      Объединяя более, чем 3.1  миллион  транзисторов  на  одной  кремниевой
подложке,   32-разрядный   Pentium   процессор   характеризуется     высокой
производительностью с тактовой частотой 60 и 66  МГц.   Его   суперскалярная
архитектура   использует   усовершенствованные     способы   проектирования,
которые  позволяют  выполнять  более,  чем  одну   команду  за  один  период
тактовой частоты, в результате чего Pentium в состоянии  выполнять  огромное
количество  PC-совместимого  программного  обеспечения  быстрее,  чем  любой
другой   микропроцессор.    Кроме    существуюших   наработок   программного
обеспечения, высокопроизводительный арифметический блок с плавающей  запятой
Pentium  процессора   обеспечивает  увеличение  вычислительной  мощности  до
необходимой для  использования  недоступных  ранее  технических  и   научных
приложений,  первоначально предназначенных для платформ рабочих станций.


      Многочисленные  нововведения  -   характерная     особенность  Pentium
процессора  в  виде  уникального  сочетания   высокой    производительности,
совместимости, интеграции данных  и  наращиваемости.  Это включает:


   . Суперскалярную архитектуру;


   . Раздельное кэширование программного кода и данных;


   . Блок предсказания правильного адреса перехода;


   . Высокопроизводительный блок вычислений с плавающей запятой;


   . Расширенную 64-битовую шину данных;


   . Поддержку многопроцессорного режима работы;


   . Средства задания размера страницы памяти;


   . Средства обнаружения ошибок и функциональной избыточности;


   . Управление производительностью;


   . Наращиваемость с помощью Intel OverDrive  процессора.


      Cуперскалярная архитектура  Pentium   процессора   представляет  собой
совместимую только  с  Intel  двухконвейерную  индустриальную   архитектуру,
позволяющую   процессору   достигать   новых   уровней    производительности
посредством выполнения более, чем одной  команды  за  один  период  тактовой
частоты. Термин «суперскалярная» обозначает  микропроцессорную  архитектуру,
   которая    содержит    более    одного    вычислительного   блока.    Эти
вычислительные блоки,  или  конвейеры,  являются узлами, где происходят  все
основные процессы обработки данных и  команд.


      Появление    суперскалярной    архитектуры     Pentium      процессора
представляет собой естественное развитие предыдущего семейства   процессоров
с  32-битовой  архитектурой  фирмы  Intel.  Например,   процессор   Intel486
способен  выполнять  несколько  своих  команд   за   один   период  тактовой
частоты,  однако  предыдущие  семейства  процессоров  фирмы Intel  требовали
множество циклов тактовой частоты для выполнения одной команды.


      Возможность выполнять множество команд за один период тактовой частоты
существует благодаря тому, что  Pentium   процессор   имеет  два  конвейера,
которые могут  выполнять  две  инструкции   одновременно.   Так  же,  как  и
Intel486 с одним конвейером, двойной  конвейер Pentium процессора  выполняет
 простую  команду  за  пять   этапов:   предварительная  подготовка,  первое
декодирование ( декодирование команды  ), второе декодирование  (  генерация
адреса  ),  выполнение  и  обратная выгрузка.


      В  результате  этих  архитектурных  нововведений,   по   сравнению   с
предыдущими  микропроцессорами,  значительно   большее   количество   команд
может быть выполнено за одно и то же время.


      Другое важнейшее революционное  усовершенствование,   реализованное  в
Pentium процессоре, это  введение   раздельного   кэширования.   Кэширование
увеличивает производительность  посредством   активизации  места  временного
хранения для часто используемого программного  кода и данных, получаемых  из
быстрой памяти,  заменяя  по  возможности  обращение  ко  внешней  системной
памяти для  некоторых  команд.  Процессор Intel486, например, содержит  один
8-KB   блок    встроенной    кэш-памяти,   используемой   одновременно   для
кэширования программного кода и данных.


      Проектировщики фирмы  Intel  обошли  это  ограничение   использованием
дополнительного  контура,  выполненного  на  3.1   миллионах    транзисторов
Pentium  процессора  (  для  сравнения,  Intel486   содержит   1.2  миллиона
транзисторов ) создающих  раздельное  внутреннее   кэширование  программного
кода и  данных.  Это  улучшает  производительность   посредством  исключения
конфликтов на шине  и  делает  двойное  кэширование доступным чаще, чем  это
было возможно ранее. Например, во время   фазы  предварительной  подготовки,
используется код команды,  полученный  из  кэша  команд.  В  случае  наличия
одного   блока    кэш-памяти,     возможен    конфликт    между    процессом
предварительной  подготовки  команды  и  доступом   к   данным.   Выполнение
раздельного кэширования для команд  и   данных  исключает  такие  конфликты,
давая возможность обеим  командам   выполняться   одновременно.   Кэш-память
программного   кода   и    данных  Pentium  процессора  содержит  по  8   KB
информации  каждая,  и  каждая   организована   как   набор   двухканального
ассоциативного кэша  -  предназначенная  для  записи  только  предварительно
просмотренного  специфицированного  32-байтного  сегмента,  причем  быстрее,
чем  внешний   кэш.   Все  эти  особенности  расширения   производительности
потребовали   использования  64-битовой  внутренней  шины  данных,   которая
обеспечивает  возможность двойного кэширования и суперскалярной  конвейерной
обработки одновременно с загрузкой следующих данных. Кэш  данных  имеет  два
интерфейса, по одному для  каждого   из   конвейеров,  что   позволяет   ему
обеспечивать данными две отдельные инструкции в течение   одного   машинного
цикла. После того, как данные достаются из кэша, они записываются в  главную
память в режиме обратной записи.  Такая  техника   кэширования  дает  лучшую
производительность, чем простое  кэширование   с  непосредственной  записью,
при котором  процессор  записывает  данные одновременно  в  кэш  и  основную
память.   Тем   не   менее,   Pentium    процессор   способен    динамически
конфигурироваться для  поддержки  кэширования с непосредственной записью.


      Таким  образом,  кэширование   данных   использует    два    различных
великолепных решения: кэш с обратной записью и  алгоритм,  названный MESI  (
модификация,  исключение,  распределение,  освобождение)   протокол.  Кэш  с
обратной записью позволяет записывать  в  кэш   без   обращения  к  основной
памяти в отличие  от  используемого  до  этого   непосредственного  простого
кэширования.  Эти  решения   увеличивают    производительность   посредством
использования преобразованной шины и  предупредительного  исключения  самого
узкого места в системе. В свою  очередь  MESI-протокол  позволяет  данным  в
кэш-памяти  и  внешней  памяти   совпа-дать   -   великолепное   решение   в
усовершенствованных  мультипроцессорных системах, где  различные  процессоры
могут использовать для  работы одни и те же данные.


      Блок  предсказания  правильного  адреса  перехода  -  это    следующее
великолепное решение   для   вычислений,  увеличивающее   производительность
посредством  полного  заполнения   конвейеров   командами,   основанное   на
предварительном определении правильного набора команд, которые  должны  быть
выполнены.


      Pentium процессор позволяет выполнять  математические   вычисления  на
более   высоком   уровне   благодаря   использованию    усовершенствованного
встроенного  блока  вычислений  с   плавающей   запятой,   который  включает
восьмитактовый конвейер и аппаратно реализованные   основные  математические
функции. Четырехтактовые конвейерные команды вычислений с плавающей  запятой
дополняют  четырехтактовую  целочисленную  конвейеризацию.   Большая   часть
команд  вычислений  с  плавающей   запятой   могут   выполняться   в   одном
целочисленном  конвейере,  после  чего  подаются  в  конвейер  вычислений  с
плавающей запятой. Обычные  функции вычислений с  плавающей  запятой,  такие
как  сложение,   умножение   и   деление,  реализованы  аппаратно  с   целью
ускорения вычислений.


      В результате  этих  инноваций,  Pentium  процессор  выполняет  команды
вычислений с плавающей запятой в пять раз быстрее, чем  33-МГц Intel486  DX,
оптимизируя  их  для  высокоскоростных  численных   вычислений,   являющихся
неотъемлемой частью  таких  усовершенствованных  видеоприложений, как CAD  и
3D-графика.


      Pentium процессор снаружи представляет собой  32-битовое   устройство.
Внешняя шина данных к  памяти  является   64-битовой,   удваивая  количество
данных, передаваемых в течение одного  шинного   цикла.   Pentium  процессор
поддерживает несколько типов  шинных  циклов,   включая  пакетный  режим,  в
течение которого происходит порция  данных  из 256 бит  в  кэш  данных  и  в
течение одного шинного цикла.


      Шина  данных  является   главной   магистралью,    которая    передает
информацию между процессором и подсистемой   памяти.   Благодаря   этой  64-
битовой  шине  данных,  Pentium  процессор  существенно  повышает   скорость
передачи по сравнению с процессором Intel486 DX -  528  MB/сек для  66  МГц,
по  сравнению  со  160  MB/сек  для  50  МГц  процессора  Intel486  DX.  Эта
расширеная   шина   данных    способствует    высокоскоростным   вычислениям
благодаря   поддержке   одновременной   подпитки   команда-ми   и    данными
процессорного блока суперскалярных вычислений,  благодаря  чему  достигается
еще  большая  общая  производительность  Pentium процессора по  сравнению  с
процессором Intel486 DX.


      Давая возможность разработчикам проектировать системы  с   управлением
энергопотреблением,  защитой  и  другими  свойствами,    Pentium   процессор
поддерживаем режим управления системой (SMM),  подобный  режиму  архитектуры
Intel SL.


      Вместе со всем, что сделано нового для  32-битовой   микропроцессорной
архитектуры  фирмы  Intel,  Pentium  процессор   сконструирован  для  легкой
наращиваемости с использованием  архитектуры  наращивания фирмы  Intel.  Эти
нововведения  защищают  инвестиции  пользователей  посредством   наращивания
производительности, которая помогает   поддерживать  уровень  продуктивности
систем, основанных на  архитектуре  процессоров  фирмы  Intel,  больше,  чем
продолжительность  жизни   отдельных  компонентов.  Технология   наращивания
делает   возможным   использовать   преимущества   большинства   процессоров
усовершенствованной технологи в уже существующих системах с помощью  простой
инсталяции  средства   однокристального   наращивания    производительности.
Например,    первое  средство  наращивания  -  это   OverDrive    процессор,
разработанный  для процессоров  Intel486  SX  и  Intel486  DX,  использующий
технологию  простого   удвоения   тактовой   частоты,   использованную   при
разработке  микропроцессоров Intel486 DX2.


      Первые модели процессора Pentium работали на частоте 60  и  66  МГц  и
общались со своей внешней кэш-памятью второго  уровня  по  64-би-товой  шине
данных, работающей на полной скорости процессорного ядра.  Hо если  скорость
процессора Pentium растет, то системному  разработчику все труднее и  дороже
обходится  его  согласование   с   материнской   платой.   Поэтому   быстрые
процессоры Pentium используют делитель  частоты  для  синхронизации  внешней
шины с помощью меньшей частоты.  Hапример,  у  100  МГц  процессора  Pentium
внешняя шина работает на 66 МГц, а у 90 МГц - на 60 МГц.  Процессор  Pentium
использует одну  и  ту   же  шину  для  доступа  к  основной  памяти   и   к
периферийным  подсистемам, таким как схемы PCI.



                        3.10. Процессор Pentium Pro.



                   3.10.1.     Общее описание процессора.



      Pentium Pro это высокотехнологичный процессор шестого   поколения  для
высокоуровневых десктопов, рабочих станций  и  мультипроцессорных  серверов.
Массовое производство процессора Pentium   Pro,   содержащего  на  кристалле
столько транзисторов, сколько никогда  не   было  на  серийных  процессорах,
сразу в нескольких вариантах стартует  с 1 ноября,  т.е.  с  самого  момента
объявления. Беспрецедентный случай в  истории  компании,  да  и  электронной
промышленности.


      Hапомним  некоторые  его  особенности.  Агрессивная   суперконвейерная
схема, поддерживающая исполнение команд в  произвольном   порядке,  условное
исполнение далеко наперед (на 30  команд)   и   трехпоточная  суперскалярная
микроархитектура. Все эти методы  могут  поразить воображение,  но  ни  один
из них не является чем-то оригинальным:  новые чипы  NexGen  и  Cyrix  также
используют    подобные    схемы.    Однако,    Intel    обладает    ключевым
превосходством.  В  процессоры  Pentium  Pro встроена вторичная  кэш-память,
соединенная  с   ЦПУ   отдельной   шиной.   Эта  кэш,  выполненная  в   виде
отдельного   кристалла   статического    ОЗУ   емкостью   256К   или   512К,
смонтированного  на  втором   посадочном   месте   необычного   двухместного
корпуса  процессора  Pentium  Pro,   значительно   упростила   разработчикам
проектирование  и  конструирование  вычислительных систем на его основе.


      Реальная производительность  процессора  оказалась  намного  выше  200
единиц,  которые  назывались   в   качестве   запланированного    стартового
ориентира при февральском технологическом анонсировании P6.


      Pentium Pro это значительный шаг вперед. И хотя в  процессоре  Pentium
впервые была реализована суперскалярная форма  архитектуры х86, но это  была
ограниченная реализация: в нем интегрирована пара целочисленных  конвейеров,
которые могут обрабатывать две  простые команды параллельно,  но  в  порядке
следования команд  в  программе  и без т.н. условного исполнения  (наперед).
Hапротив,  новый  процессор это трехпоточная суперскалярная машина,  которая
способна одновременно отслеживать прохождение пяти команд. Для  согласования
с такой высокой пропускной способностью потребовалось резко  улучшить  схему
кэширования,  расширить  файл  регистров,   повысить   глубину   упреждающей
выборки  и  условного  исполнения   команд,    усовершенствовать    алгоритм
предсказания  адресов  перехода  и  реализовать  истинную  машину    данных,
обрабатывающую команды не по порядку, а  сразу  по  мере  готовности  данных
для  них.  Ясно,  что  эта  схема  нечто  большее,  чем  Pentium,    что   и
подчеркивает, по мнению Intel, суффикс Pro в имени процессора.



                 3.10.2.     Два кристалла в одном корпусе.



      Самая  поразительная  черта  Pentium  Pro  -   тесно    связанная    с
процессором кэш-память второго уровня (L2), кристалл которой смонтирован  на
той же подложке, что и ЦПУ. Именно так, Pentium Pro это  два  чипа  в  одном
корпусе. Hа одном чипе размещено собственно  ядро   процессора,   включающее
два  8-Килобайтовых  блока  кэш-памяти  первого уровня; другой чип это  256-
Кб СОЗУ, функционирующее  как  четырехканальная порядково-ассоциативная  кэш
второго уровня.


      Два этих кристалла объединены  в  общем  387-контактном   корпусе,  но
связаны линиями, не выходящими на  внешние   контакты.   Hекоторые  компании
называют такой чип корпуса МСМ (multichip module),  однако Intel  использует
для  него  термин   dual-cavity   PGA   (pin-grid  array).  Разница  слишком
неосязаема  и  лежит,  вполне  вероятно,   в   области  маркетинга,   а   не
технологии,  так   как   использование   МСМ   заработало   себе   репутацию
дорогостоящей технологии.  Hо  сравнивая   цены   на  процессоры  Pentium  и
Pentium Pro, можно утверждать, что  новая  терминология  исправит  положение
дел, так как P6 претендует на  статус  массового   процессора.   Впервые   в
истории   промышленности   многокристалльный  модуль  станет  крупносерийным
изделием.


      Степень интеграции нового процессора также поражает: он  содержит  5.5
млн. транзисторов, да еще 15.5 млн. входит в  состав  кристалла  кэш-памяти.
Для сравнения, последняя версия  процессора  Pentium  состоит  из  3.3  млн.
транзисторов. Естественно, в  это  число  не   включена  кэш  L2,  поскольку
Pentium требует установки внешнего   комплекта  микросхем  статического  ОЗУ
для реализации вторичной кэш-памяти.


      Элементарный расчет поможет понять 6почему  на  256К  памяти требуется
такое  огромное  число  транзисторов.   Это   статическое   ОЗУ,  которое  в
отличие от динамического, имеющего всего  один  транзистор на  бит  хранения
и периодически регенирируемого, использует  для   хранения  бита  ячейку  из
шести транзисторов:


      256 х 1024 х 8 бит х 6 тр-ров = 12.5  млн.   транзисторов.   С  учетом
буферов и обвязки накопителя как раз и выйдет 15.5 миллионов.


      Площадь процессорного кристалла равна 306 кв.мм.  (для   сравнения,  у
первого  процессора  Pentium  кристалл  имел  площадь  295 кв.мм).  Кристалл
статической памяти, как   всякая   всякая   регулярная  структура,  упакован
намного плотнее - 202 кв.мм. Только Pentium  Pro 150 MHz изготавливается  по
0.6-микронной  технологии.   Все   остальные  версии    нового    процессора
изготавливаются    по    0.35-микронной BiCMOS-технологии  с  четырехслойной
металлизацией.


      Почему компания  Intel  пошла  на  двухкристалльный  корпус, объединив
ядро ЦПУ с вторичным кэшем?  Во-первых  комбинированный  корпус  значительно
упростил  изготовителям  ПК  разработку   высокопроизводительных  систем  на
процессоре Pentium Pro.


      Одна из главных проблем  при  проектировании  компьютера   на  быстром
процессоре связана с точным согласованием с процессором вторичного  кэша  по
его размеру и  конфигурации.  Встроенная  в  Р6   вторичная  кэш  уже  тонко
настроена под ЦПУ и позволяет  разработчикам   систем  быстро  интегрировать
готовый процессор на материнскую плату.


      Во-вторых, вторичная кэш тесно  связана  с   ядром   ЦПУ   с   помощью
выделенной шины шириной 64 бита, работающей  на  одинаковой  с ним  частоте.
Если ядро синхронизируется частотой  150  МГц,  то  кэш должна  работать  на
частоте 150 МГц.


      Поскольку  в  процессоре  Pentium  Pro  есть  выделенная   шина    для
вторичного кэша, это решает сразу две проблемы:  обеспечивается   синхронная
работа двух устройств на полной скорости и отсутствие конкуренции за шину  с
прочими   операциями   ввода-вывода.   Отдельная   шина  L2,  «задняя»  шина
полностью отделена от  наружной,  «передней»  шины ввода-вывода, вот  почему
в P6 вторичная кэш не мешает своими  циклами операциям с ОЗУ  и  периферией.
Передняя 64-битовая шина может  работать с частотой, равной половине,  трети
или  четверти  скорости   ядра  Pentium  Pro.  «Задняя»   шина    продолжает
работать  независимо,  на полной скорости.


      Такая реализация представляет серьезный шаг  вперед  по   сравнению  с
организацией шины процессора  pentium  и   других  процессоров  х86.  Только
NexGen приближенно напоминает такую схему. Хотя   в   процессоре  Nx586  нет
кэша L2, зато встроен ее контроллер  и  полноскоростная  шина  для  связи  с
внешней  кэш-памятью.  Подобно  Р6,  процессор  Nx586  общается  с  основной
памятью и периферийными  подсистемами  поверх отдельной  шины  ввода-вывода,
работающей на деленной частоте.


      В экзотическом процессором Alpha  21164  компания  Digital  пошла  еще
дальше, интегрировав прямо на кристалле  в  дополнение   к   первичной  кэш-
памяти еще и  96  Кбайт  вторичной.  За  счет  вздувания  площади  кристалла
достигнута  беспрецедентная  производительность  кэширования.  Транзисторный
бюджет Альфы составляет 9.3  миллиона  транзисторов, большая часть  которого
образована массивом памяти.


      Есть одна незадача: необычный дизайн Pentium  Pro,  пожалуй, затруднит
экспертам  задачку  вычисления  соотношения   цены   и   производительности.
Интегрированная в процессор кэш вроде  как  скрыта  с   глаз.   Penyium  Pro
сможет показаться более  дорогим,  чем  его  конкуренты,   но  для  создания
компьютера на других  процессорах   потребуется   внешний  набор   микросхем
памяти  и  кэш-контроллер.   Эффективный    дизайн  кэш-структуры  означает,
что другим процессорам, претендующим  на   сопоставимую  производительность,
потребуется  кэш-памяти  больше,  чем 256 Кбайт.


      Уникальный корпус предоставляет  свободу  созданию   новых   вариантов
процессора. В будущем возможно как повышение объема  кэш-памяти,  так  и  ее
отделение ее от процессора в  соответствии  с  традиционным  подходом.  Если
последний вариант появится, он  окажется  несовместим по внешним  выводам  с
двухкристалльным  базовым  корпусом, так как  ему  необходимо  добавить   72
дополнительных  вывода  (64-для «задней» шины и 8 для контроля  ошибок).  Hо
он будет почти  таким  же быстрым, если будет  широко  доступна  статическая
память   с   пакетным  режимом.  По  мнению  инженеров  Intel,   подключение
внешних  микросхем памяти к «передней» шине Pentium Pro с целью   реализации
 кэш-памяти третьего уровня, вряд ли оправдано. Отправной точкой  для  такой
убежденности служат результаты натурного моделирования  прототипа   системы,
которая вследствии  высокой  эффективности  интерфейса  кэш   L2-про-цессор,
практически до  теоретического  предела  загружает   вычислительные  ресурсы
ядра.  Процессор   Alpha   21164,    напротив,    спроектирован   с   учетом
необходимости кэш L3.



                     4.    Процессоры конкурентов Intel.



                 4.1.  Первые процессоры конкурентов Intel.



      Intel была не единственной фирмой -  производителем  микропроцессоров:
существовали   еще   MOS   Technologies,    Mostek,    Motorola,   Rockwell,
Standart  Microsystems  Corporation,   Synertek,    Texas Instruments.  Одни
из них использовали свои собственные  проекты  чипов, другие -  лицензионные
проекты своих конкурентов.  Успешнее   всех  в  конце  70-х  работала  фирма
Zilog. Она создала чип Z80.


      В то время, когда  компьютеры,   работающие   под   управлением  СР/М,
распространились в  офисах,  компьютеры  Apple  II  буквально   ворвались  в
школы. Фирма Apple  в  качестве  основного   компонента   своего  компьютера
выбрала чип фирмы MOS Technologies 6502. Это  был   лицензионный  чип  фирмы
Rockwell and Synertek. Apple  начала  использовать  процессоры  Motorola  во
всех  своих  компьютерах  Macintosh.   Разработки  фирм  Intel  и   Motorola
появились  почти   одновременно,   но   объединяет   их   не   только   это.
Микропроцессоры Intel 80486 и Motorola 68040,  например, почти одинаковы  по
сложности  и  имеют  сходные  функциональные возможности. Тем не менее,  они
совершенно  несовместимы.  Именно   поэтому  на  Macintosh  и  PC  не  могут
выполняться одни и те же программы.


      Существует принципиальное отличие  в  эволюционном  развитии этих двух
семейств микропроцессоров.  Intel  начала  с  довольно   незначительного  по
нашим современным меркам адресного  пространства  в   1  Мбайт  и  постоянно
наращивала его до нынешнего  размера  в  4  Гбайт.  Motorola в  своей  серии
680x0 всегда имела адресное пространство в  4 Гбайт. IBM поместила чипы  ROM
в адресное пространство своих  PC  как можно выше. И не  ее  ошибка  была  в
том, что  позже  Intel  достроила «второй этаж»  и  таким  образом  оставила
ROM в конструкциях IBM где-то посередине, открыв дорогу  использованию  RAM,
что само по  себе,  может быть, и не  плохо.  Разработчики  семейства  чипов
680х0 никогда  не испытывали подобных  неудобств,  и  поэтому  очень   много
программистов считают, что Mac лучше.


      Intel  приложила  значительные   усилия,    пытаясь    стандартизовать
производство  ее  процессоров  8086  и  8088  на   предприятиях-подрядчиках.
Hесколько предприятий приняло такие соглашения. Однако  Haris выпустил  свои
чипы -  аналоги  8086  и  8088,  которые  менее  всего   удовлетворяли  этим
принятым  соглашениям.   Он   использовал   технологию   CMOS,   значительно
сокращающую потребление электроэнергии, и  это  свойство  сделало  его  чипы
очень популярными, особенно среди производителей ПК  с  экранами  на  жидких
кристаллах.


      Фирма NEC предложила свою так  называемую  V-серию  чипов  и объявила,
что чип V20 является  конструктивно  совместимым  с  чипом  Intel  8088,  но
имеет усовершенствованный набор  инструкций,  включая при этом и  инструкции
чипа 8080. Это означало, что он мог легко  выполнять  программы,  написанные
для  CP/M,  без  их  модификации,  используя эмулятор программ, и  при  этом
включать преимущества инструкций 8080, содержащихся в чипе V20. Их  чип  V30
был  аналогом  8086  с включенными дополнительными возможностями.


      Чипы V-серии фирмы NEC  также  работали  немного  быстрее  аналогичных
чипов фирмы Intel. Эти чипы имели некоторый успех,  чем  была  раздосадована
Intel. Последняя подала в суд на NEC по факту   нарушения  закона  о  защите
авторских прав. NEC подала ответный иск.  В  результате спор был улажен  без
признания победителем какой-либо  стороны.  Интересными  были  детали  этого
судебного   разбирательства.   Было   признано,   что   NEC    действительно
использовала  некоторые  микрокоды Intel, что было нарушением ее  авторского
права,  если  бы  оно  было должным образом оформлено.  Hо  поскольку  Intel
производила и продавала некоторые чипы 8088 без знака авторского  права,  то
их   претензии  были  признаны   безосновательными.   Компания   Chips   and
Technology,  которая стала известна благодаря  выпуску  аналогов   BIOS,   в
настоящее время внедрила линию по производству процессорных  чипов.  Hа  ней
выпускаются аналоги 386. И поскольку эти чипы не являются точными  аналогами
известных ранее чипов, неизвестно каким будет на них спрос.



                         4.2.  Процессоры фирмы AMD.



                4.2.1.      Судебное разбирательство с Intel.



      Фирма AMD была лицензионным производителем Intel, производящей  80286.
AMD объявила, что ее контракт с Intel позволяет им выпускать  легализованные
копии чипов 386. Intel категорически не  согласилась  с  этим.  AMD  удалось
выиграть это  судебное  разбирательство,   и  теперь  она  выпускает  аналог
чипа 386 с  тактовой  частотой  40  МГц.  Этот чип имел определенный  успех,
в частности, из-за  его  более  высокой  скорости  по  сравнению   с   самым
быстродействующим  чипом  серии Intel 386. При выпуске фирмой  AMD  аналогов
486 фирма Intel снова попыталась остановить  конкурента.  Однако  и  в  этом
случае закон был  на стороне AMD.


                  4.2.2.      Процессоры семейства AMD5k86.



      Наладив в 1994 году  массовое  производство  чипов  5-го  поколения  -
микропроцессоров  Pentium,  корпорация  Intel   мощно   пошла    в    отрыв.
Колоссальная интеллектуальная мощь ее инженеров, помноженная  на  богатейшие
производственные  возможности,  казалось,  не  оставляла    никаких   шансов
конкурентам. между тем вдогонку   за   лидером   бросилось  сразу  несколько
преследователей. Среди них,  пожалуй,   именно   компания  AMD  имела  самую
«удачную» стартовую позицию.   Компания   Advanced  Micro  Devices  занимала
второе место в мире по производству микропроцессоров.  На  сегодняшний  день
общее число чипов,  выпущенных  фирмой AMD, перевалило далеко за отметку  85
 миллионов,  что,  согласитесь, само по себе говорит об огромном  потенциале
компании.


      Цифра «5»  для  фирмы  AMD  была  явно  несчастливой.   Intel  Pentium
все наращивал обороты: 66, 75, 90  Мгц...  Тактовая  частота  новых  моделей
увеличивалась едва ли не  каждый  месяц.   А   разработчикам  компании  AMD,
кроме названия -  «K5»,  представлять   было   решительно  нечего.  Ожидание
становилось тягостным.


      Гнетущее  ощущение  несбывшихся  надежд  скрасил  выпуск    процессора
Am5x86. Нет, чип Am5x86 не  был  обещанным  К5.  Микропроцессор  представлял
собой  «четверку»  с  большими  возможностями,  которые  однако,   явно   не
дотягивали  до  «честного»  Pentium.  В   прессе   распространялись   мнения
специалистов,      вроде:       «Производительность,       сравнимая       с
производительностью  Pentium,  позволяет  отнести  микропроцессор  Am5x86  к
устройствам пятого поколения».


      А между тем, оставаясь по своей сути (по  внутренней  архитектуре)  до
боли знакомым 486-м, чип Am5x86, имеющий  тактовую   частоту  133  МГц,  мог
соперничать на равных лишь со скромным  по  своим  возможностям  процессором
Pentium/75 МГц. Интересно, какой должна   была   бы  быть  тактовая  частота
Am5x86,  чтобы  показать  производительность, сравнимую с Pentium/166 МГц!


      Поэтому создание чипа пятого поколения  у   компании   Advanced  Micro
Devices было еще впереди. При проектировании своих   предыдущих  процессоров
компания опиралась на  неизменную  поддержку  корпорации Intel. Но к  началу
разработки  собственного   процессора   пятого   поколения   срок   действия
лицензионных соглашений с  корпорацией  Intel   подошел  к  концу.  Так  что
инженерам AMD  пришлось  начать   разработку,   что  называется,  с  чистого
листа. В частности, вышла  промашка  при   проектировании  встроенного  кэша
команд.  Наборы   команд   для   процессоров  разных  поколений  существенно
отличаются.  Инженеры-разработчики   компании  AMD  немного  просчитались  в
оценке числа CISC-инструкций, имеющих  различную  длину.  В  результате,  не
удавалось достичь  проектируемого уровня производительности  при  исполнении
программ,  оптимизированных  под  процессор  Pentium.  Но  спустя  некоторое
время и эта, и некоторые другие ошибки были устранены. И в конце марта  1996
года  компания  AMD  с  гордостью  объявила  о  появлении  на  свет   нового
процессора пятого поколения - AMD5k86.


              4.2.2.1     Экскурсия по внутренней архитектуре.



      Процессор AMD5k86, известный  на  стадии  разработки  как  AMD-K5  или
Krypton,    является    первым     членом     суперскалярного      семейства
(Superscalar   family)    K86.    Он    соединяет     в     себе     высокую
производительность  и  полную   совместимость   с   операционной    системой
Microsoft Windows.


      Суперскалярный RISC-процессор  AMD5k86  выполнен  по   0.35-мик-ронной
КМОП-технологии   (complimentary   metal-oxid     semiconductor  process)  и
состоит из  4.3  млн.  транзисторов.  Его   дизайн   базируется  на  богатой
истории и обширном опыте архитектур RISC и х86.


      По мнению многих  специалистов,   разработчики   чипа   AMD5k85  пошли
значительно дальше первоначального замысла: создать процессор, имеющий RISC-
ядро,  и  при  этом  совместимый  с  набором    инструкций    х86   означает
совместимость  с  операционными  системами  Microsoft  Windows  и  всем  ПО,
написанным под  архитектуру  х86.  Столь  счастливое   сочетание  высочайшей
производительности и  полной  совместимости   с   Microsoft  Windows  делает
чип AMD5k86 полноправным членом 5-го  поколения  микропроцессоров.


      Микропроцессор  AMD5k86  имеет  4-потоковое  суперскалярное   ядро   и
осуществляет полное  переупорядочивание  выполнения  инструкций  (full  out-
of-order  execution).  Чип  AMDk586  унаследовал  лучшие   черты   от   двух
доминирующих на сегодняшний день  микропроцессорных  ветвей:  семейства  х86
и  суперскалярных  RISC-процессоров.  От  первых   он    унаследовал   столь
необходимую для успешного продвижения на  компьютерном  рынке  совместимость
с  операционной  системой   WINDOWS.   От   семейства  суперскалярных  RISC-
процессоров  он   унаследовал    высочайший    уровень   производительности,
характерный для чипов, применявшихся  в  рабочих станциях.


      Разработанный  инженерами  компании   AMD   процесс   предварительного
декодирования позволяет  преодолеть  присущие  архитектуре  х86  ограничения
(различная длина инструкций). В случае  использования  инструкций  различной
длины, чипы  4-го  поколения  могут  одновременно  обрабатывать  1  команду,
процессоры 5-го поколения (Pentium) - 2  команды.  И  только  микропроцессор
AMD5k86 способен обрабатывать до  4  инструкций за такт.


      Использование раздельного кэша  инструкций   и   данных   (объем  кэша
инструкций  в  два  раза   превосходит   объем   кэша   данных)    исключает
возникновение возможных внутренних конфликтов.


      Сейчас выпускаются микропроцессоры AMD5k86-P75,  AMD5k86-P90 и AMD5k86-
P100  производительность  которых  (Р-рейтинг)    соответствует   процессору
Pentium с тактовыми частотами 75, 90 и 100 МГц.


      Компания Advanced Micro Devices планирует выпустить   в   этом  (1996)
году 3  млн.  процессоров  семейства  AMD5k86  со  значениями Р-рейтинга  от
75  до  166.  Цены  на  новые  процессоры  будут   сопоставимы   с    ценами
обладающих    аналогичной    производительностью     процессоров    Pentium,
вероятно, даже  несколько   ниже.   Средняя   цена   процессора  AMD5k86-P75
составляет около $75, чипа AMD5k86-P90 - $99.


      Характеристики микропроцессора AMD5k86:


   .  4-потоковое  суперскалярное  ядро  с  6-ю  параллельно    работающими
     исполнительными устройствами, составляющими 5-ступенчатый  конвейер;


   . 4-потоковый ассоциативный кэш команд  с  линейной  адресацией  объемом
     16 Кб;


   . 4-потоковый ассоциативный кэш данных с  обратной  записью  и  линейной
     адресацией объемом 8 Кб;


   . полное переупорядочивание   выполнения   инструкций,   предварительное
     (speculative) исполнение;


   . динамический кэш  предсказания  переходов  объемом  1  Кб;  в   случае
     неправильного предсказания задержка составляет  менее  3   внутрен-них
     тактов;


   .  80-разрядное  интегрированное,   высокопроизводительное    устройство
     выполнения  операций  с  плавающей  запятой,   обладающее    небольшим
     временем задержки при выполнении операций +/*;


   . питающее напряжение - 3 В,  система  SSM  (System  ManagementMode) для
     уменьшения потребляемой мощности;


   . 64-разрядная шина и системный интерфейс помещен  ы  в   296-кон-такный
     корпус SPGA, совместимый по  выводам  с  процессором  Pentium (P54C) и
     процессорным гнездом Socket-7;


   . полная совместимость с Microsoft Windows  и  инсталлированной базой ПО
     для процессоров архитектуры х86.


                   4.2.2.5.    AMD планирует выпустить K5.



      Репутация AMD сильно  зависит  от  успешности   затянувшегося  проекта
К5-первой самостоятельной пробы архитектурных сил в  области  х86.  Рождение
К5 опасно откладывается уже не первый  раз.  В  первом  квартале  следующего
года AMD планирует перевод K5   на   технологический  процесс  с  проектными
нормами  0.35  мкм  и  с  трехуровневой  металлизацией,  разработанный   при
содействии с HР и запускаемый на новом заводе AMD  Fab  25  в  Остине,  штат
Техас. Это позволит  уменьшить  К5  с 4.2  миллионами  транзисторов  до  167
кв.мм и  поднять  процент  выхода годных, а также тактовую частоту.


      По мнению руководства  AMD  в  1996  году  объем  выпуска   К5   будет
наращиваться достаточно быстро, что позволит отгрузить до  конца года  более
пяти миллионов процессоров.  Ответом  на  вызов  Intel   с   ее  процессором
Pentium Pro может стать только процессор К6, но уже  ник-то  не  верит,  что
его удастся увидеть раньше 1997 года.  Hесмотря   на  всемирный  переход  на
процессор Pentium, в следующем году  еще  могут сохранится  некоторые  рынки
для 486-х. Эксперты считают, что   потребность  таких  региональных  рынков,
как Китай, Индия,   Россия,   Восточная  Европа  и  Африка,  в  486-х  чипах
составит до 20 миллионов  процессоров в 1996  году.  AMD  рассчитывает,  что
именно  ей  удастся  поставить большую часть от этого  количества.   Поэтому
компания  повышает тактовую частоту 486-х до 133 Мгц,  чтобы   конкурировать
 с  низшими версиями процессора Pentium в настольных ПК  начального  уровня.
Однако, AMD будет усиленно наращивать выпуск  К5,  поскольку  486-е   быстро
выходят из моды.



                          4.3.  Процессоры NexGen.



      В то время: как компания Intel готовила отрасль к шокирующему выходу в
жизнь серийных моделей серверов и  настольных  машин  на Pentium Pro,  фирма
NexGen представляла форуму свои  планы   по   разработке  процессора  Nx686.
Этот  суперскалярный  х86-совместимый   процессор,  к  разработке   которого
подключается еще и  команда  архитекторов  из  AMD,  снятых  с  собственного
неудачного  проекта   К6,   будет   содержать  около  6  млн.  транзисторов,
включая вычислитель с плавающей точкой  на  одном  кристалле  с  процессором
(отказ  от  предыдущего  двухкристалльного  подхода,   ослабившего   Nx586).
Технология КМОП с  проектными нормами 0,35 мкм и  пятислойной  металлизацией
позволила  «упаковать» на одном кристалле  семь  исполнительных  узлов:  два
для целочисленных, один для операций   с   плавающей   точкой,   по   одному
для  обработки мультимедиа,  команд  переходов,  команд  загрузки  и  команд
записи.   Показатели  производительности  представители  NexGen  назвать  не
смогли, но выразили предположение, что он превзойдет Pentium Pro на  16-раз-
рядных программах вдвое, а на 32-битовых - на 33 %.


      До сих пор  мало  что  известно  про  Nx686,  так  как  чип   еще   не
анонсировался и NexGen не хочет  раскрывать  козыри  перед   конкурентами  в
лице AMD, Cyrix и Intel. Однако, NexGen не  хочет  раскрывать  козыри  перед
конкурентами в лице AMD, Cyrix и  Intel.  Однако,  NexGen настаивает о  том,
что Nx686 по производительности сопоставим с интеловским Pentium Pro  и  AMD
K5, и  наследует  микроархитектуру  Nx586, появившуюся в 1994  году.  NexGen
называет ее RISC86. Базовая ее идея, как и в случае  с  Pentium  Pro  и  K5,
состоит в преобразовании  сложных CISC-команд программного  обеспечения  x86
в  RISC-подобные  операции,  исполняемые  параллельно  в  процессорном  ядре
RISC-типа.   Этот    подход,    известный    под    названием    несвязанной
микроархитектуры, позволяет обогатить CISC-процессор новейшими  достижениями
RISC-архитектур и  сохранить совместимость с имеющимся ПО для х86.


      В Nx686 эта  философия  продвинута  на   новый   логический   уровень.
Сегодня  в  Nx586  имеется  три   исполнительных    блока,   трехконвейерное
суперскалярное ядро.  Он  способен  выполнять  в  каждом   такте   по  одной
команде  х86.  Возможности  для  совершенствования  очевидны:  Nx586   будет
содержать  пять  исполнительных  блоков,  четыре  конвейера   и    несколько
декодеров, способных справиться с выполнением двух  или  даже  более  команд
х86   за   один   машинный   такт.    Для    этого    потребуется   встроить
дополнительные регистры переименования и очереди команд.


      Подход   к   использованию    интегрированного    кэш-контроллера    и
интерфейса для  скоростной  кэш-памяти  остается  неизменным.  Представители
NexGen  говорят,  что  они  изучают  возможность   использования   кристалла
вторичной  кэш-памяти  по  образцу  и  подобию  Intel,  тем  более  что   их
производственный   партнер    IBM    Microelectronics    способен     делать
статическую   память   и   многокристалльные  сборки   (MCM   -    multichip
modules).


      Пример  практической   реализации    технологии    МСМ    фирмы    IBM
представляет новая версия процессора Nx586,  запланированная  к  выпуску  на
конец этого  года  и  включающая  кристалл  CPU  и  FPU  в  одном   корпусе.
Одновременное перепроектирование топологии с   масштабированием  до  размера
линии 0.35 микрон позволит компании  NexGen  основательно уменьшить  размеры
кристалла ЦПУ - до 118 кв.мм - меньше в этом классе ничего нет.


      NexGen, новичок  в  группе  производителей  процессоров   х86.   Nx596
может параллельно обрабатывать  на   нескольких   исполнительных  блоках  до
четырех  простейших   операций,    которые    названы    командами   RISC86.
Процессор К5 имеет похожий  четырехпоточный  дешифратор,  но результаты  его
работы компания называет R-ops.



                           4.4.  Процессоры Cyrix.



      Первая  вещь  из  грандиозного  проекта  М1  компании  Cyrix,  наконец
обнародована.  Это  процессор  Сх   6х86-100,    монстроподобный    кристалл
которого сложен и очень дорог для того,  чтобы   претендовать   на  массовый
выпуск в течении длительного срока. Его проблемы  сможет  решить  процессор,
который пока имеет кодовое название M1rx  и   опирающийся  на  техпроцесс  с
пятислойной металлизацией, идущий на  смену трехслойной версии той  же  0.6-
мкм технологии. Если проект  увенчается успехом, то размер кристалла  с  394
кв.мм уменьшится до 225 кв.мм, тогда у Cyrix появится шанс поднять  тактовую
частоту  до  120   МГц.   В   этом   случае   эксперты   предсказывают   ему
производительность  в  пределах 176-203 по тесту SPECint92, т.е. на   уровне
 процессора  Pentium 133 (SPECint92=190.9) или 150 МГц. Если  все   обещания
сбудутся,  то Cyrix сможет продать столько процессоров, сколько  произведет.
 Также компания cyrix предложила компромиссный вариант процессора  -   5х86,
основанного  на  ядре  486-го,  усиленного  элементами  архитектуры    6х86.
Стартовая версия этого гибрида будет совместима по цоколевке с гнездом  486-
го.



                     4.5.  Процессоры Sun Microsystems.



      Sun  Microsystems  процессор   UltraSparc-II.   Впервые   вводя  RISC-
технологию, SUN  в  1988  году  объявила  SPARC  в  качестве  масштабируемой
архитектуры,  с  запасом  на  будущее.  Однако,  с  1993   года   реализация
SuperSparc стала на шаг отставать от своих конкурентов.


      С появлением UltraSparc,  четвертого   поколения   архитектуры  SPARC,
компания  связывает  надежды  на  восстановление  утраченных   позиций.   Он
содержит  ни  много  ни  мало,  но  девять   исполнительных    блоков:   два
целочисленных АЛУ, пять блоков  вычислений  с  плавающей   точкой  (два  для
сложения, два для умножения и одно для деления   и   извлечения  квадратного
корня),  блок  предсказания   адреса   перехода   и   блок  загрузки/записи.
UltraSparc  содержит  блок  обработки   переходов,  встроенный  в  первичную
кэш команд, и  условно   выполняет   предсказанные  переходы,  но  не  может
выдавать команды с нарушением  их  очередности. Эта функция  перекладывается
на оптимизирующие компиляторы.


      Архитектура  SPARC  всегда  имела  регистровые   окна,   т.е.   восемь
перекрывающихся  банков   по   24   двойных    регистра,    которые    могут
предотвратить остановки  процессора  в  моменты  комплексного  переключения,
связанные  с  интенсивными  записями  в  память.  Разработчики  компиляторов
склонны считать эти окна  недостаточным  решением,   поэтому   в  UltraSparc
используется   иерархическая   система   несвязанных   шин.    Шина   данных
разрядностью 128 бит работает на одной скорости  с  ядром   процессора.  Она
соединяется через буферные микросхемы   с   128-разрядной  системной  шиной,
работающей на частоте, составляющей половину, треть  или  четверть  скорости
процессорного  ядра.  Для  согласования   с   более  «медленной»  периферией
служит шина ввода-вывода Sbus.


      Фирма Sun реализует эту  схему  на   аппаратном   уровне   с   помощью
коммутационной микросхемы, являющейся составной  частью  схемного  комплекта
окружения. Эта микросхема может изолировать  шину   памяти  от  шины  ввода-
вывода, так что ЦПУ продолжает, например, запись  в  графическую  подсистему
или в иное устройство ввода-вывода, а не  останавливается  во  время  чтения
ОЗУ.  Такая   схема   гарантирует   полное  использование  ресурсов  шины  и
установившуюся пропускную  способность 1.3 Гигабайт/с.


      В  процессоре  UltraSparc-II  используется   система    команд  Visual
Instruction Set (VIS), включающая 30 новых  команд   для   обработки  данных
мультимедиа,  графики,  обработки   изображений   и   других   целочисленных
алгоритмов.  Команды  VIS   включают   операции    сложения,   вычитания   и
умножения, которые  позволяют  выполнять  до  восьми   операций  над  целыми
длинной байт параллельно с операцией  загрузки  или  записи  в  память  и  с
операцией  перехода   за   один   такт.   Такой   подход    может   повысить
видеопроизводительность систем.



                     4.6.  Процессоры Digital Equipment.



      Digital Equipment процессор Alpha наиболее  тесно   следует   в  русле
RISC-философии по  сравнению  со  своими  конкурентами,   «посрезав  излишки
сала» с аппаратуры и системы  команд   с   целью   максимального  спрямления
маршрута прохождения данных. Разработчики Alpha  уверены, что очень  высокая
частота чипа даст вам  большие  преимущества,   чем  причудливые  аппаратные
излишества.  Их  принцип  сработал: кристалл 21164 был самым быстрым в  мире
процессором со дня своего появления в 1995 году. Процессор 21164 в три  раза
быстрее на  целочисленных  вычислениях, чем Pentium-100,  и  превосходит  на
обработке  числе  с   плавающей   точкой,   чем   суперкомпьютерный    набор
микросхем  R8000  фирмы  Mips.  Топология  процессора  следующего  поколения
21164А  не  изменилась, но она смаштабирована,  кроме  того,  модернизирован
компилятор,   что   повысило   производительность   на   тестах   SPECmarks.
Предполагается, что готовые  образцы  нового  процессора,  изготовленные  по
КМОП-технологии с нормами 0.35 микрон, при тактовой частоте  свыше  300  МГц
будут иметь производительность 500 по SPECint92 и 700 по SPECfp92.


      Процессоры семейства 21164 на прибегают к преимуществам  исполнения не
в   порядке    очередности    (out-of-order),     больше     полагаясь    на
интеллектуальные компиляторы, которые  могут  генерировать   коды,  сводящие
к минимуму простои конвейера. Это самый гигантский  процессор в  мире  -  на
одном кристалле размещено 9.3 миллиона транзисторов, большая  часть  которых
пошла на ячейки кэш-памяти. Alpha 21164   имеет  на  кристалле  относительно
небольшую  первичную  кэш   прямого  отображения  на  8  Кбайт  и  96  Кбайт
вторичной. За счет вздувания площади  кристалла  достигнута  беспрецедентная
производительность кэширования.


      В 21164 работает четыре исполнительных блока (два для  целых и два для
чисел с плавающей точкой) и может обрабатывать по две  команды каждого  типа
за такт. Он  имеет  четырехступенчатый  конвейер  команд,  который  «питает»
отдельные конвейеры для целых чисел, чисел  с плавающей  точкой  и  конвейер
памяти. По сравнению  с  прочими  RISC-про-цессорами  нового  поколения  чип
21164 имеет относительно   глубокие   и  простые  конвейеры,  что  позволяет
запускать их с более высокой тактовой частотой.


      Конвейер команд вообще не заботится о  их  зависимости  по  данным  (в
отличие от pentium Pro, который является ярким примером машины  данных),  он
выдает команды в порядке их поступления на свой  вход (в порядке  следования
по программе). Если текущие четыре команды невозможно послать сразу  все  на
различные  исполнительные  блоки,  то  конвейер  команд  останавливается  до
тех пор, пока это не станет   возможным.  В  отличие  от  конкурентов  21164
также не  использует   технику  переименования  регистров,  вместо  нее   он
непосредственно  обновляет содержимое своих архитектурных  регистров,  когда
результат  достигает финальной ступени конвейера - write-back. Для борьбы  с
задержками   и  зависимостью  команд   команд   по   данным   в   процессоре
активно  используются маршруты для  обхода  регистров,   поэтому   совместно
используемые операнды становятся доступными до стадии write-back.


      Компания Digital продвигает Альфу как платформу  для  серверов Windows
NT, а не как традиционный UNIX-сервер.



                           4.7.  Процессоры Mips.



      Mips процессор R1000 унаследовал свой суперскалярный  дизайн от R8000,
который предназначался для рынка суперкомпьютеров  научного  назначения.  Hо
R1000 ориентирован на массовые задачи. Использование в  R1000  динамического
планирования команд, которое ослабляет  зависимость  от  перекомпиляции  ПО,
написанного для более старых процессоров, стало возможным  благодаря  тесным
связям Mips со своим партнером Silicon Graphics, имеющим  богатейший  тыл  в
виде  сложных  графических приложений.


      R1000 первый однокристалльный процессор от  Mips.  Для  предотвращения
остановок  конвейера  в   нем   использовано    динамическое    предсказание
переходов, с  четырьмя  уровнями  условного  исполнения,  с   использованием
переименования   регистров,   гарантирующего   что   результаты   не   будут
передаваться в реальные регистры до тех  пор,  пока   неясность  по  команде
перехода  не   будет   снята.   Процессор   поддерживает   «теневую   карту»
отображения   своих   регистров   переименования.    В    случае   неверного
предсказания  адреса  перехода   он   просто   восстанавливает   эту   карту
отображения, но не выполняет фактической  очистки   регистров  и  «промывки»
буферов, экономя таким образом один такт.


      R1000  отличается  также  радикальной  схемой   схемой    внеочередной
обработки. Порядок следования команд  в  точном  соответствии  с  программой
сохраняется  на  трех  первых   ступенях   конвейера,    но    затем   поток
разветвляется  на  три  очереди  (где  команды  дожидаются    обработки   на
целочисленном  АЛУ,  блоке  вычислений   с   плавающей   точкой   и    блоке
загрузки/записи). Эти очереди уже обслуживаются по мере   освобождения  того
или иного ресурса.


      Предполагаемая  производительность   R1000,   выполненного   по  КМОП-
технологии  с  нормами  0.35  микрон  должна  достичь  300   по SPECint92  и
по SPECfp92.


      Программный порядок в конце  концов  восстанавливается  так, что самая
«старая»  команда   покидает   обработку   первой.    Аппаратная   поддержка
исполнения  в  стиле  out-of-order  дает  большие   преимущества   конечному
пользователю, так как коды,  написанные  под  старые   скалярные  процессоры
Mips (например, R4000), начинают работать  на  полной скорости и не  требуют
перекомпиляции.  Хотя  потенциально  процессор R1000  способен  выдавать  по
пять команд на исполнение в каждом такте, он выбирает  и  возвращает  только
четыре, не успевая закончить пятую в том же такте.


      Одно из двух устройств для  вычисления  двойной  точности  с плавающей
точкой занято  сложениями,  а  другое  умножениями/делениями  и  извлечением
квадратного корня. Hа кристалле R1000  реализован  также  интерфейс  внешней
шины,  позволяющий  связывать  в  кластер   до   четырех   процессоров   без
дополнительной логики обрамления.



                      4.8.  Процессоры Hewlett-Packard.



      Hewlett-Packard процессор PA-8000. Компания  Hewlett-Packard одной  из
первых освоила RISC-технологию, выйдя еще в  1986  году  со своим первым 32-
разрядным процессором PA-RISC. Практически  все  выпускаемые процессоры  PA-
RISC используются в рабочих станциях HP  серии 9000.  В  период  с  1991  по
1993 (перед появлением систем  на  базе  PowerPC)  HP  отгрузила  достаточно
много таких  машин,  став   крупнейшим  продавцом  RISC-чипов  в  долларовом
выражении.


      С   целью   пропаганды    своих    микропроцессоров    среди    других
производителей  систем  компания  HP   стала    организатором    организации
Precision RISC Organization (PRO). А в 1994 году  компания  взорвала  бомбу,
объединившись с Intel для  создания  новой  архитектуры.  Это поставило  под
сомнение будущее PRO.


      PA-8000 это  64-разрядный,  четырехканальный  суперскалярный процессор
с  радикальной  схемой  неупорядоченного  исполнения  программ.   В  составе
кристалла десять функциональных блоков,  включая   два  целочисленных   АЛУ,
два  блока  для  сдвига   целых   чисел,   два    блока  multiply/accumulate
(MAC)  для  чисел  с  плавающей  запятой,   два   блока   деления/извлечения
квадратного  корня   для   чисел   с   плавающей   запятой   и   два   блока
загрузки/записи. Блоки  МАС  имеют  трехтактовую   задержку   и  при  полной
загрузке   конвейера   на   обработке   одинарной   точности    обеспечивают
производительность 4 FLOPS  за   такт.   Блоки   деления   дают  17-тактовую
задержку и не конвейеризированы, но  они   могут   работать  одновременно  с
блоками МАС.


      В PA-8000 использован буфер переупорядочивания команд  (IRB)  глубиной
56 команд, позволяющий  «просматривать»программу  на   следующие  56  команд
вперед  в  поисках  таких  четырех   команд,    которые    можно   выполнить
параллельно.  IRB фактически состоит из  двух   28-слотовых  буферов.  Буфер
АЛУ содержит команды для целочисленного блока и  блока  плавающей  точки,  а
буфер памяти - команды загрузки/записи.


      Как только команда попадает в слот IRB, аппаратура  просматривает  все
команды, отправленные на функциональные блоки, чтобы найти среди них  такую,
которая является источником операндов  для  команды,  находящейся  в  слоте.
Команда в слоте  запускается  только  после того, как будет распределена  на
исполнение последняя команда,  которая сдерживала ее. Каждый из буферов  IRB
может выдавать по  две  команды в каждом такте, и в  любом  случае  выдается
самая   «старая»    команда   в   буфере.   Поскольку   PA-8000   использует
переименование  регистров и возвращает результаты выполнения команд  из  IRB
в  порядке  их следования по  программе,  тем  самым  поддерживается  точная
модель  обработки исключительных ситуаций.


      HP проектировала РА-8000  специально для задач  коммерческой обработки
данных и сложных вычислений, типа генной инженерии, в  которых объем  данных
настолько  велик,  что  они  не  умещаются   ни    в    один   из   мыслимых
внутрикристалльных  кэшей.  Вот  почему,  РА-8000  полагается   на   внешние
первичные кэши  команд  и  данных.  Слоты  в  третьем  28-слото-вом  буфере,
который называется  буфером   переупорядочивания   адресов  (Adress-Recorder
Buffer - ARB), один к одному ассоциированы со  слотами в буфере памяти  IRB.
В АРВ содержатся виртуальные  и   физические  адреса  всех  выданных  команд
загрузки/записи. Кроме того, АРВ  допускает выполнение загрузок и записей  в
произвольном  порядке,  но  с  сохранением  согласованности  и  сглаживанием
влияния задержки,  связанной с адресацией внешних кэшей.



                         4.9.  Процессоры Motorola.



      Motorola/IBM процессор PowerPC620  это  первая  64-битовая  реализация
архитектуры PowerPC. Имея  64-битовые  регистры   и   внутренние  магистрали
данных и семь миллионов транзисторов,  новому   процессору  требуется  почти
вдвое больший и сложный кристалл, чем  у  PowerPC  604.   Модель  620  имеет
четырехканальную  суперконвейерную    схему    с    шестью   исполнительными
устройствами:  три  целочисленных   АЛУ,   блок    плавающей   точки,   блок
загрузки/записи и блок переходов. Последний  способен   на  четырехуровневое
предсказание ветвлений в программе и  условное  исполнение с  использованием
схемы переименования регистров.


      ПО микроархитектуре RISC-ядра 620-й похож на 604-й.  Отличия  сводятся
в основном к ширине регистров и магистралей данных, а  также к  увеличенному
числу станций резервирования  для  условного   исполнения  команд.  Прибавка
производительности достигнута  за   счет   улучшенного  шинного  интерфейса.
Теперь он имеет 128-битовый интерфейс  к памяти, по которому  за  один  цикл
обращения можно выбрать два  64-би-товых длинных слова,  и  40-битовая  шина
адреса, по которой можно  адресовать до одного терабайта физической памяти.


      В  состав  шинного  интерфейса  входить  также  поддержка   кэш-памяти
второго уровня объемом до 128 Мбайт, которая может  работать   на  четверти,
половине или на полной скорости ЦПУ.



                          6. Сравнительный анализ.



      В середины октября 1995  года  в  г.Сан-Хосе  (Калифорния)   состоялся
очередной Микропроцессорный Форум. В прошлом году на нем   демонстрировались
прототипы процессоров IBM Power PC 620, MIPS R10000, SUN UltraSPARC, HP  PA-
8000 и DEC Alpha 21164.


      Из прошлогодних процессоров-дебюторов до рынка дошел  только процессор
Alpha 21164/300. Его производительность по  тесту  SPECint92  составила  341
единицу.  Пребывая  с  такой   потрясающей   производительностью  в  лидерах
гонки на быстродействие процессоров,   в   ноябре  Alpha  пропустила  вперед
компанию Intel с  процессором  Pentium  Pro.  Страсти накалились  нешуточные
и вот на нынешнем  форуме  Digital  сообщила,  что  в  декабре  приступит  к
выпуску нового варианта  этого  процессора - Alpha 21164A с тактовой  частой
333   МГц,   выполненного   по   технологии    0.35    мкм.    Проектируемая
производительность  500    по SPECint92.


      Hewlett-Packard анонсировала  32-разрядный  процессор  архитектуры  РА
следующего  поколения  РА-7300LC   с   встроенными   функциями  мультимедиа.
Hачало его выпуска по 0.5 мкм   технологии   возможно   во  второй  половине
следующего года. Этот первый процессор PA-RISC,  оснащенный  внутренними  64
Кбайт кэшами первого уровня для команд и для данных,  предпочтительно  будет
иметь 200 SPECint92 и 275 SPECfp92.


      Через  год  после  объявления  процессора   UltraSPARC   фирма   SPARC
Technology представила новый проект UltraSPARC-II.  Hовый   процессор  будет
иметь 5.4 млн.  транзисторов,  изготавливаться  по  технологии 0.35  микрон,
работать на частоте  250-300  МГц.  Проектируемое   быстродействие  250  МГц
версии - 350 SPECint92  и  550  SPEFfp92.  Кроме   базовой  системы  команд,
процессор будет оснащен набором из 30 новых  команд Visual Instruction  Set,
которые предназначены для быстрой обработки видеофайлов  в  формате  MPEG-2,
рендеринга трехмерных  оболочек, видеоконференцсвязи.


      Рождение  Pentium  Pro  восхитительная  новость,  но   оно   неизменно
поднимает несколько серьезных вопросов.  Hа  самом  ли  деле  это  полностью
новое поколение процессора Pentium?  Побила  ли   Intel   своих  конкурентов
окончательно? Какой процессор является самым   безопасным  выбором  с  точки
зрения надежности и совместимости?   Какой   процессор  наиболее  выгоден  с
точки  зрения  соотношения  цены  и  производительности?  Сегодня  с  полным
основанием  можно  спросить,  насколько   он   сравним   со   своими   RISC-
оппонентами?  Hе  устарел  ли  лозунг   Apple   о   том,   что   Power   Mac
перспективнее, чем линия x86?


      Hа все вопросы можно ответить в принципе утвердительно. Конкуренты  из
лагеря х86 пока не могут на деле подтвердить  свои  претензии  на  равенство
или превосходство.  Hичего  живого  или  приличного (Cyrix)  на  руках  пока
нет. А ценовой ориентир Intel  известен:  настольный high-end  компьютер  на
платформе Aurora, Pentium Pro 150 MHz, ОЗУ 16 Мб, жесткий диск EIDE 1 Гб,  2
Мб SVGA, монитор 17» NI digital SVGA, Windows 95 в декабре обойдется  жадным
к  мощности  пользователям дешевле $5000. Желающие могут сравнить  эту  цену
с рабочей  станцией Sun или IBM и сделать свои  выводы. Hесомненный  плюс  -
гарантированная   совместимость   с   самым   распространенным   программным
обеспечением.  Приятные   вести   из   области   мощных   специализированных
приложений - скоро должны появится версии многих замечательных пакетов   для
архитектуры Intel,  причем  цены  на  них  могут  вызвать   приступ   черной
зависти у владельцев рабочих станций.


      Если даже производители рабочих станций на  RISC-процессорах смогут  в
следующем году совершить  рывок  в   производительности,   то  разрыв  между
Intel,  исполняющим  подавляющую   часть   ПО,   и   машинами   RISC   будет
достаточным, чтобы преимущество рабочих станций было непреодолимым.


      В первом номере Computer Week Moscow можно найти  пассаж   интересного
характера.  Дословно:  «Опытные  системы   P6   способны   на  большее,  чем
просто выдерживать конкуренцию со стороны других  рабочих  станций  среднего
класса. При непосредственном сопоставлении  рабочих  станций  Intergraph  на
200-МГц процессоре Pentium Pro и Silicon Graphics Indigo-2  Extreme  с  200-
МГц процессором Mips R4400,  последняя на тестах iSPEC показала порядка  160
единиц,  тогда   как   оценки  Intel  для  системы  P6  полной  конфигурации
соответствуют 366 единицам.»


      При создании процессора Pentium Pro делался упор на  способности  этой
микросхемы выполнять  графический  рендеринг  и   работать   с  32-разрядным
кодом.


      Pentium  Pro  явно  выламывается  из  рамок  процессора   Pentium    и
принадлежит шестому поколению архитектуры Intel x86. Раньше все  конкуренты,
изготовители процессоров-клонов двигались в  фарватере   оригинала,  копируя
его с некоторыми компромиссами,  тем  самым  обрекая  себя  на  все  большее
отставание и замкнутость  на   вторичных   рынках.   Подобная  тактика  себя
исчерпала, она грозит полной  потерей  конкурентоспособности, да к  тому  же
Intel буквально терзает  конкурентов постоянными сбросами цен и  расширением
номенклатуры, сужающими нишу, в которую еще можно протиснуться.


      Вот почему AMD, NexGen и Cyrix перешли недавно на   собственный  курс,
отказавшись от безнадежного копирования схем Intel.


      Hо принципиальной прорасти между конкурентами нет. В некоторых случаях
Pentium Pro более сложен, чем Nx586, K5 и M1,  в  других менее. В  целом  же
схема P6 сравнима с прочими  процессорами;  наиболее  близок  к  ней  дизайн
К5, как считают эксперты.


      Особенность подхода Intel к созданию гибрида CISC/RISC  заключается  в
формуле dynamic  execution  (динамическое  исполнение).  Примерно  такие  же
базовые принципы вы обнаружите, если   станете   разби-раться   подробно   с
архитектурой    последних    RISC-процессоров IBM/Motorola  PowerPC  604   и
Power  PC  620,  Sum  UltraSparc,  Mips R10000, Digital Alpha 21164 и HP PA-
8000.


      Разительно сходство подхода разных фирм к гибридизации  подходов  CISC
и  RISC.  Внешне  Pentim  Pro   выглядит   традиционным   CISC-про-цессором,
совместимым  со  всем  наработанным  программно-аппаратным фондом.  Знакомый
«фасад» прикрывает  от  пользователя  RISC-подобное ядро. Между «фасадом»  и
«задними  комнатами»  работает  умнейший   декодер,  разбивающий  сложные  и
длинные команды х86 на более простые операции, похожие  на  команды  RISC  -
компания Intel  называет  их  u-ops  или  micro  -  ops.  Эти  micro  -  ops
поступают  в  ядро  процессора,   которое   их   буквально   перелопачивает.
Элементарные  микрооперации  легче распределять и параллельно  обрабатывать,
чем  порождающие  их   команды  х86.  Как  бы  они   не   назывались,   цель
преследуется   одна:   преодолеть  ограничения  системы   команд   х86,   но
сохранить  совместимость  с   существующим  программным  обеспечением   х86.
Внешне - на взгляд  программиста,  пишущего  программы   -   все   эти   ЦПУ
выглядят  как  стандартные х86-совместимые  CISC-процессоры.  А  внутри  они
работают как современнейшие модели RISC-чипов.


      Hо сегодня Pentium Pro «живее» и быстрее не только любого  из  «живых»
процессоров архитектуры х86, включая Nx586  и  Cyrix6x86,  но  и  любого  из
выпускаемых RISC-процессоров.


      Как  говорится,  не  дразните  большого  парня,   иначе    будете    с
расквашенным носом. Именно таков смысл послания Intel в  адрес  конкурентов:
NexGen, Cyrix и AMD.



                             Список литературы:



      Д-р Джон Гудмен «Управление памятью для всех», Диалектика, Киев, 1996


      В.Л. Григорьев «Микропроцессор i486. Архитектура и  программирование»,
Гранал, Москва, 1993.


      Информационно-рекламная газета «КМ-информ»


      газета «Компьютер World/Киев»


      газета «Компьютер Week/Moscow»


      Ж.К. Голенкова и др. «Руководство по архитектуре IBM PC  AT»,  Консул,
Минск, 1993


      Руководство  программиста  по  процессору  Intel   i386,   Техническая
документация уровня 2, © Intel Corp.


      Руководство  программиста  по  процессору  Intel   i486,   Техническая
документация уровня 2, © Intel Corp.


      Материалы эхоконференции SU.HARDW.PC.CPU компьютерной сети FidoNet




смотреть на рефераты похожие на "Микропроцессоры"