VI. Необходимость преемственности моделей МП семейства Х86
Преемственность достигалась путем:
1) соответствующего развития регистровых ресурсов;
2) использования R- режима работы процессоров;
3) введения V- режима работы процессоров.
1982 г.ознаменовался началом нового, принципиального этапа в развитии архитектуры Х86. Появился на рынке новый МП i80286, также 16-ти разрядный,но в котором были введены существенные архитектурные новшества. Его характеристики были следующие: f = 15 и 20 МГц; максимально адресуемое ОЗУ –16 Мбайт (24-х разрядная шина адреса); N = 134 тысячи транзисторов; технология – 1,5 мкм. В МП i80286 были введены следующие новшества:
1) защищенный режим работы;
2) стал выделяться R-режим работы МП этого семейства (режим работы, моделирующий работу МП i8086;
3) адресация памяти через дескрипторные таблицы;
4) использование виртуальной памяти, емкостью до 1 Гбайт;
5) многозадачный режим работы поддерживаемый аппаратно.
Эти процессоры использовались в ПК фирмы IBM (в ПК IBM PC/ATи младших моделях IBM PS/2).Однако, введенные в МП i80286 новшества, в этих компьютерах по настоящему так и не использовались. Зато они были широко развиты в дальнейших модификациях МП семейства Х86. Практически, процессоры i80286 использовались как очень быстрые МП типа i8086/88.
Развитие МП архитектуры IA-32
1985 г.в истории развития компьютерной техники стал очень важной вехой. На рынке появился МП i80386, первый 32-х разрядный микропроцессор, который открыл, так называемую линию IA – 32(Intel Architecture – 32-х разрядная), линию 32 разрядных микропроцессоров фирмы Intel, основополагающие принципы построения которых продолжают использоваться во многих современных семействах микропроцессоров. Характеристики этого МП были следующие: f =20 Мгц; максимально адресуемое ОЗУ = 4 Гбайта (32 разрядная адресная шина); виртуальная память – до 64 Тбайт; N = 275 тысяч транзисторов; технология – 1,5 мкм. В этом МП существенно доработан защищенный режим работы и, кроме реального режима (R – режима, который введен, был уже в МП i80286) появился новый, виртуальный режим работы, в котором могло одновременно эмулироваться несколько R – режимов как отдельных задач. Кроме этого, в МП i80386 введено страничное управление памятью и появилась кэш-память, правда еще на отдельном кристалле. Этот МП получил очень широкое распространение, при нем появилась Microsoft Windows,сначала как оболочка операционной системы DOS, а затем как самостоятельная операционная система. Выпускался i80386 в нескольких модификациях – i80386SX, i80387SL и др.
1989 г.Появился МП i80486с характеристиками: f = 25, 33, 50, 66 и 100 МГц; Максимально адресуемое ОЗУ = 4 Гбайта; N =1,2 миллиона транзисторов, технология – 1,0 ; 0,8 и 0,7 микрона. Он выпускался разными фирмами в целом ряде вариантов – 486DX, 486DX2, 486SLC2, 486SX, и др. Несмотря на то, что МП i486 не стал крупным шагом вперед по сравнению с МП i386, в него введены серьезные внутренние изменения, а именно:
1) введен конвейер обработки команд, имеющий 5 ступеней (стадий);
2) напряжение питания уменьшено до 3,3 В;
3) память кэш L1 увеличена до 16 Кбайт и размещена на кристалле МП;
4) арифметический сопроцессор FPU также размещен на кристалле МП;
5) для повышения производительности в нем впервые применено
RISC – ядро, которое затем стало обязательной принадлежностью
всех дальнейших МП семейства IA – 32;
6) разработан и введен режим SMM(System Management Mode – режим управления системой), который имеет несколько назначений, главным из которых является снижение потребляемой мощности, если возникает длительный простой процессора (при этом автоматически отключаются основные блоки процессора, не требующиеся для сохранения информации).
1993 г.ознаменовался разработкой фирмой Intel нового микропроцессора архитектуры Х86 под названием Pentium. По логике развития названий МП этой архитектуры его следовало бы определить как i80586, однако этого не случилось по следующей причине. Многие фирмы, производящие МП архитектуры Х86, стали вносить в них свои изменения, но оставлять те названия, которые присваивала им исходный разработчик этого семейства МП фирма Intel. Так фирма AMD выпустила свой несколько модернизированный 32-разрядный МП этой архитектуры и назвала его 486SX. Фирма Intel подала на фирму AMD в суд, но суд не удовлетворил ее претензии, и вынес вердикт в том смысле, что числа не патентуются. Поэтому-то фирма Intel, процессор, следующий за i486, назвала не i586, как следовало бы, а Pentium. Характеристики МП Pentium были следующие: f =60…233 МГц; максимально адресуемое ОЗУ = 4 Гбайта; виртуальная память – до 64 Тбайт; N = 3,1 миллиона транзисторов; технология – 0,8; 0,6 и 0,35 мкм; U = 5 и 3,3 В.
Основные новшества, введенные в этот МП, по сравнению с i486 были следующие:
1) суперконвейерная архитектура, включающая два конвейера команд (по 5 ступеней), и позволяющая за один такт выполнять более одной команды (до двух команд);
2) конвейерное устройство для обработки данных с плавающей запятой;
3) раздельные внутренние кэш L1 для команд и данных, емкостью по 8 Кбайт каждая.
4) два буфера предвыборки команд (взамен очереди команд). Один из них обеспечивает предвыборку команд на линейном участке программы (обычно 5-8 команд). Другой служит для предвыборки команд в соответствии с алгоритмом функционирования буфера BTB(Branch Target Buffer – буфер целевого ветвления), в котором храниться информация о последних 256 переходах. Это обеспечивает предсказание ветвлений в программе. Причем вероятность правильных предсказаний достигает 80%.
5) 64 – разрядная внешняя шина данных, хотя внутренняя шина
данных осталась, как и у всех процессоров линейки Х86, 32-х разрядная.
Процессоры Pentium принято относить к 5-му поколению МП фирмы Intel, семейства iX86. К нему также относят и МПPentium MMX (Multi Media Extensions – мультимедийное расширение), хотя последний появился в продаже только в 1997 г.Дело в том, что Pentium MMX отличался от Pentium незначительно: увеличением тактовой частоты до 266 МГц и уменьшением напряжения питания с 3,3В, до 2,8В и, кроме того, объем памяти кэш L2 увеличен вдвое, до 32 Кбайт. Увеличена на одну ступень длина конвейера (стало 6 ступеней). Основной же его особенностью, которая дала ему новое название, явилось введение ММХ – новых 57 инструкций и несколько новых типов данных. Основной идеей введения ММХ было дать программисту возможность упаковать несколько элементов данных в один 64 разрядный пакет и затем выполнить одну из новых операций ММХ над этим пакетом, обработав, таким образом, за один раз все упакованные элементы данных. Поэтому эта технология получила название технологией SIMD(Single Instruction – Multiple Data, одна инструкция – множественные данные). Новые типы данных варьируются от пакета из 8 байт данных, упакованных совместно, до 64-разрядного числа. Интересно, что для выполнения любой ММХ – операции в МП Pentium MMX, временно используются восемь 64 – разрядных регистров сопроцессора FPU, представляющих его стек, предназначенный для работы с плавающей запятой. Таким образом, хотя логические устройства процессора, занятые обработкой ММХ – информации, существуют отдельно от устройства для работы с плавающей запятой, они делят между собой общий регистр, выполняя в нем свои операции. Результатом появления технологии ММХ стало улучшение работы мультимедиа-приложений, содержащих в себе сложные графические подсистемы и активно использующие качественные видео и звук. Кроме этого технология ММХ используются широко и в других приложениях.
1995 г.стал годом выпуска на рынок процессоров семейства Х86 нового, шестого поколения (или, как иногда пишут, процессоров Pentium второго поколения). Первым из таких процессоров стал МП Pentium Pro (Pentium Professional). Отметим, однако, что технология ММХ в него введена не была.
Основные характеристики его были следующие: f = 150…200 МГц; максимально адресуемое ОЗУ = 64 Гбайта (результат введения 36 разрядной адресной шины); N = 5,5 миллионов транзисторов; U = 3,3 В; технология – 0,6 и 0,35 мкм; память кэш L1 = 16 Кбайт (8 Кбайт для команд и 8 Кбайт для данных). Особенностью этих процессоров являлось то, что память кэш L2 была выполнена на одном кристалле с процессором. Это позволило увеличить производительность процессора за счет уменьшения времени обращения к кэш памяти второго уровня. Кэш L2 у этих процессоров, в зависимости от модификации, устанавливалась объемом 256, 512 и даже до 1024 Кбайта и включала в себя до 15,5 миллионов транзисторов.
Главное отличие МП шестого поколения, первым представителем которых явился МП Pentium Pro, заключалось в следующем.
1) Использовалось 3 конвейера по 12 ступеней (стадий) в каждом конвейере.
2) Введено динамическое исполнение команд – комбинация методов предсказания множественных ветвлений, анализа прохождения данных и виртуального выполнения. При этом внутри процессора инструкции могут выполняться не в том порядке, который предполагает программный код. Это позволяет загружать конвейер, если для какой-то команды нет еще выбранных данных. В связи с этим, вероятность предсказания правильности переходов возросла до 90%.
3) Применена архитектура независимой двойной шины, повышающей суммарную пропускную способность. Одна шина – системная – служит для общения ядра процессора с основной памятью и интерфейсными устройствами, другая – внутренняя – предназначена исключительно для обмена информацией процессора с памятью КЭШ L2.
4) Впервые введено внутреннее умножение частоты в самом процессоре.
1997 г.ознаменовался появлением на рынке МП под названием Pentium II. Этот процессор является сочетанием архитектуры МП Pentium Pro с технологией ММХ. Его характеристики: f =200…600 МГц; максимально адресуемое ОЗУ = 64 Гбайт; число конвейеров и число ступеней в них осталось то же что и в процессорах Pentium Pro: 3 конвейера по 14 ступеней в каждом. N = 7,5 миллиона транзисторов (плюс 11,5 миллиона транзисторов, составляющих память кэш L2 и размещенных на отдельных кристаллах в том же корпусе картриджа). Кэш L1 был увеличен вдвое, до 32 Кбайт (16+16). Максимальный объем кэш L2 достигал 2 Мбайт (выполнялся в различных вариантах по объему). Следует отметить, однако, что внутренняя шина Pentium II, соединяющая кэш L2 и CPU работает на частоте, равной лишь половине частоты тактового генератора, в отличие от Pentium Pro, шина которого работает на полной частоте. U = 2,8…2 В (ядра процессора). Выполнялся этот тип процессора по технологии 0,35 и 0,25 мкм. В МП Pentium II использовалась технология ММХ, но с добавлением нескольких новых команд ММХ. Выпускался МП Pentium II во многих модификациях.
Для массового рынка персональных компьютеров офисного или домашнего использования с 1998 г. стал выпускаться упрощенный вариант МП Pentium II - МП Celeron.Эти МП имели такие же характеристики по f , и технологии производства, как и МП Pentium II, но не имели внутренней памяти кэш L2, или имели ее в уменьшенном объеме. Кроме того, разрядность шины адреса сокращена с 36 до 32, т.е. максимально адресуемая память уменьшилась снова до 4 Гбайт. Это позволило существенно увеличить процент выхода годных микросхем МП и почти в три раза уменьшить их стоимость.
В 1999г.на рынке появился МП Pentium III.Он также выпускался во многих модификациях (с ядрами Katmai, Xeon, Tanner, Coppermine и др.). Основные характеристики его следующие: f = 450 МГц …1,13 ГГц; максимально адресуемое ОЗУ = 64 Гбайта; число используемых конвейеров -3 (два для целочисленных вычислений и один для операций с плавающей запятой); ступеней конвейера – 10; N = 9,5…28 миллионов транзисторов; технология – 0,25, 0,18 и 0,13 мкм. Различные модификации МП Pentium III, размещались как в картриджах с отдельным кристаллом для кэш L2 подобно Pentium II, так и в обычном корпусе, вставляемым в разъем типа Socket, при размещении и CPU и кэш L2 на едином кристалле.
Особенностью процессоров Pentium III является.
1) Введение расширенного набора инструкций, который получил название ММХ2. Он включал в себя дополнительно 70 команд для SIMD использования, причем 50 из них приходится на команды для оптимизации операций с плавающей запятой (одной командой обрабатываются до 4 арифметических действий). Этот расширенный набор инструкций был чрезвычайно важен для трехмерных игр, 3-х мерных пейзажей со сложными тенями, перевода устных фраз в текстовую фразу и др. Использование этого расширенного набора команд SIMD получило название технологии SSE(Streaming SIMD Extension – потоковые расширения SIMD).
2) Для того, чтобы освободить регистры FPU при использовании SIMD команд, в МП Pentium III, введены дополнительно восемь 128-разрядных регистров специально для выполнения инструкций SIMD-FP.
В 2000 г.поступил в продажу МП новый тип МП Celeron (в некоторых публикациях именуемый Celeron II), который при сравнительной дешевизне имел характеристики мало уступающие Pentium III. Следует отметить, что такие недорогие процессоры для ПК обычно строились на базе High-End процессоров, но отличались от последних пониженной тактовой частотой ядра и системной шины, а также «урезанным» КЭШем L2. Особенностью такого рода процессоров фирмы Intel является то, что все они выпускались под названием Celeron.. Если обобщить характеристики всех, выпущенных МП типа Celeron к 2003 году, начиная с 2000 года, то получим следующие данные:
f = 560 МГц…2,2 ГГц; максимально адресуемое ОЗУ = 64 Гбайт; N = до 20 миллионов транзисторов; технология – 0,18…0,13 мкм; Uпит = 1,7…1,475 В; тепловыделение 17,9…29,9 Вт; кэш L1 = 32 Кбайт (16+16); кэш L2 = 128…512 Кбайт; используется технология SIMD (70 команд и больше).
В конце 2000 г.на рынке появился МП Pentium 4.Он был разработан по новой микроархитектуре, получившей название NetBurst. Сразу же отметим, что только до апреля 2003 г. было выпущено 53 различных моделей этого процессора. Различались эти модели не только частотой, но и типом корпуса, технологическим процессом производства, напряжением питания ядра процессора, мощностью тепловыделения, максимальной температурой корпуса и степпингом (версией). Корпуса, в котором выпускались Pentium 4, имеют название: FC-PGA2 478 и LGA 775 (у МП Pentium 4 Extreme Edition). Тактовые частоты его различных моделей лежат в диапазоне 1,3…3,46 ГГц, хотя еще в конце 2002 г. на конференции в г. Сан–Хозе корпорация Intel продемонстрировала МП Pentium 4 с тактовой частотой 4,1 ГГц. Эффективная частота системной шины FSB (Front Side Bus) этого МП = 400, 533, 800, 1066 МГц. Технологический процесс – 0,18 (ядро Willamette), 0,13 мкм (ядро – Northwood) и 0,09мкм (ядро Prescott). Ядро процессора Pentium 4 может иметь степпинг (версию) B0, B2, C1, D0, DP и E1. Степпингом определяется и напряжение питания ядра процессора, и тепловыделение, и максимальная температура процессора. N - от 55 до 169 миллионов транзисторов. Uпит ядра = 1,7…1,5 В. Тепловыделение - от 82 до 130 Вт. Кэш L1: - для команд 12000 декодированных инструкций, для данных 8 Кбайт. Кэш L2 – 256 Кбайт. (У Pentium 4 Extreme Edition имеется еще и Кэш L3 – 2 Мбайт).
Дополнительные особенности МП Pentium 4 следующие.
1) Число конвейеров доведено до 6 (4 для целочисленных вычислений и 2 для операций с плавающей запятой).
1) Использована, так называемая гиперконвейерная технология (20 ступеней конвейера, а с ядром Prescott даже 31 ступень).
2) Введены дополнительно 144 дополнительные инструкции Streaming SIMD Extension, после чего эта технология получила название SSE2. Как известно, SSE – инструкции позволяют за один такт обработать до четырех чисел типа Float (числа с плавающей запятой с одинарной точностью), но не могут работать с числами типа Double. А в наборе инструкций SSE2 появилась возможность обработать за один такт до двух чисел типа double.
3) Эффективная частота системной шины (FSB) была доведена до 800 МГц, при физической частоте – 200 МГц (технология Quard Pumping – 4 блока
данных за один такт). А в МП Pentium 4 Extreme Edition – до 1066 МГц при физической частоте – 266 МГц.
4) Введена технология Hyper-Threading (впервые опробованная в серверном процессоре Xeon). Теоретически, она позволяет поднять производительность процессора на 25 %. Суть этой технологии заключается в том, что при выполнении одного процесса в процессоре используются, в какие то моменты времени не все существующие в нем блоки. И эти блоки могут быть в это время использованы другим процессом. Технология Hyper-Threading позволяет благодаря этому операционной системе видеть один процессор как два. В результате этот единственный процессор может одновременно иметь дело с двумя приложениями (или одним много-потоковым), повышая производительность системы. Отметим, однако, что эта технология появилась в МП Pentium 4, только начиная с модификации с f = 3,06 ГГц.
5) Память кэш L1 команд изменила свою сущность. На ступень декодирования команды (инструкции) поступают непосредственно из кэш L2, и в кэш L1 микропроцессора Pentium 4 хранятся уже декодированные команды (инструкции). Поэтому, когда рассматривают микропроцессор Pentium 4 , то говорят не о памяти кэш L1 команд или инструкций, а о памяти кэш L1 декодированных микроинструкций с отслеживанием исполнения (Trace Cache). Наличие такого кэша – одна из составляющих микроархитектуры NetBurst.
6) Еще одним новшеством, характерным для микроархитектуры NetBurst, является введение двух исполнительных блоков, оперирующих с целыми числами, которые работают на удвоенной скорости (с частотой в два раза превышающей тактовую частоту процессора).
Практика использования процессоров Pentium 4 показала, что уже при тактовой частоте в 4 ГГц рассеиваемая мощность процессора, даже при технологическом процессе, равном 90 нм, достигает 135 Вт. При этом затраты на устройства охлаждения процессора настолько удорожают его стоимость, что его использование становится экономически невыгодным. Поэтому дальнейшая стратегия развития высокопроизводительных процессоров, на обозримый период времени, заключается не в увеличении тактовой частоты, а в разработке новых технологий обработки информации, в частности, в создании двуядерных и многоядерных процессоров.
Развитие архитектуры IA-64
Еще в 1994 году компании Intel и HP (Hewlett-Packard), основываясь на опыте HP в области высокопроизводительных компьютерных систем и возможностях Intel по разработке и производству широко доступных процессоров, объединили свои усилия, образовав альянс по разработке новой высокопроизводительной 64-разрядной архитектуры. В октябре 1998 г. компания Intel объявила о планах развития 64-разрядных процессоров семейства Intel Itanium. Основное назначение этих МП – использование в мощных, высокопроизводительных и высоконадежных серверах, для решения задач любой сложности, построения корпоративных центров обработки данных, систем обработки транзакций, систем управления ресурсами предприятия, систем поддержки принятия решений, сложных технических и математических расчетов в различных областях инженерной, научной и технологической деятельности. И, поэтому стоимость их довольно высока и использование их в персональных компьютерах - нерациональна. Так, сервер, построенный на 64-разрядной платформе, стоит не один десяток тысяч долларов, что, естественно, по средствам только кооперативным заказчикам. Да и работа, скажем, с адресуемым пространством свыше 4 Гбайт, необходимая для обработки сверхбольших СУБД, пользователю ПК фактически сегодня не нужна.
С мая 2001 годабыл начат массовый выпуск процессоров Intel Itanium (Merced) и продуктов фирмы HP на их основе. Уже в июне 2001 г. была достигнута рекордная производительность для операций с плавающей запятой по тесту SPECfp2000, намного выше, чем у Ultra SPARC, Alpha и PA-RISC, хотя при выполнении операций с целыми числами результаты были сопоставимы с ними. Первые экземпляры МП Itanium имели f =900 МГц с технологией 0,18 мкм и медными проводниками. Основные особенности его были следующие.
1) Совершенно новая, по сравнению МП семейства Х86 система команд, которая получила общее название ISA(Instruction Set Architecture). Здесь Intel впервые отошла от своего принципа преемственности, поскольку хотела объединить достоинства CISC и RISC архитектур, существенно уменьшив их недостатки. Однако предусмотрено и выполнение программ, написанных в командах семейства Х86
2) Принятая система команд реализует уже упоминаемую технологию EPIC(Explicitly Parallel Instruction Computing – вычисления с заданным (явным) параллелизмом команд). Напомним, что эта технология предусматривает возможность параллельной обработки большого числа команд. Традиционные процессоры также позволяют иногда параллельно выполнять несколько команд, но при этом ценные ресурсы процессора расходуются на то, чтобы определить какие именно команды могут быть обработаны параллельно. Иначе обстоит дело при использовании технологии EPIC: здесь эти решения заблаговременно принимаются программными компиляторами, так что код поступает в процессор как бы отформатированным для параллельной обработки несколькими конвейерами. При этом компилятор не только освобождает процессор от решения этих задач. Он решает их быстрее, так что в процессе параллельной обработки выполняется больший объем работы. Кроме того, в наборе команд IA-64 реализованы функции прогнозирования (что позволяет устранять ветвление кода, повышая тем самым уровень параллелизма) и предварительной интеллектуальной оценки данных (data speculation), позволяющей предугадывать какие именно данные потребуются для выполнения команды, и сокращает тем самым время ожидания процессора и задержки при доступе к памяти.
3) В процессоре Itanium предусмотрено огромное число внутренних регистров – по 128 для выполнения целочисленных операций и операций с плавающей точкой, а это дает возможность сократить число обращений к памяти.
4) 64 разрядная шина адреса, в принципе, дает возможность непосредственно адресовать 2 байт информации, т.е. 16 эксабайт » 18 миллиардов Гигабайт. Следовательно, он может существенно лучше справляться с обработкой крупных массивов данных при выполнении таких задач как добыча информации.
5) Картридж процессора включает в себя кэш L3 с объемом 2 или 4 Мбайт (при кэш LI = 32 Кбайта и кэш L2 = 96 Кбайт).
В начале 2003 года фирма Intel объявила о создании новой версии процессора Intel Itanium 2. Этот МП производится по 0,13 микронной технологии. В связи с этим удалось снизить напряжение питания ядра процессора (1,3 вместо 1,5 В), значительно увеличить кэш-память третьего уровня (L3) до 6 Мбайт и поднять тактовую частоту процессора до 1,5 ГГц – вместо 1,0 ГГц в предыдущей версии процессора. В то же время, в этих процессорах используется уже более 450 встроенных регистров.
Первое время Intel к созданию 64 разрядных процессоров, предназначенных для персональных компьютеров, отнеслась отрицательно, однако в феврале 2005 года было объявлено о появлении на рынке целого ряда процессоров, которые, сохраняя 32-разрадную шину данных, используют специальную технологию Intel EM64T (Extended Memory 64 Technology), и поэтому могут использовать адресное пространство, соответствующее 64 разрядной адресной шине. К таким процессорам относились:
- Линейка процессоров Intel Pentium 4 Extreme Edition с тактовыми частотами fт = 3,4; 3,46 и 3,73 ГГц. Число транзисторов в них достигает 169 миллионов. КЭШ L2 = 2 Мбайт.
- Линейка процессоров Intel Pentium 4 6xx: (Pentium 4 630 - с fт = 3,00 ГГц; Pentium 4 640 – с fт =3,20 ГГц; Pentium 4 650 – с fт =3,40 ГГц, и Pentium 4 660 – с fт=3,60 ГГц); FSB=800 МГц; N = 169 млн. транзисторов. При этом в процессорах шестисотой серии использован КЭШ L2 объемом 2 Мбайт.
Большинство этих процессоров изготавливались по технологии 90 и 65 нм.