Узкие места интерфейсов

При планировании конфигурации своего компьютера постарайтесь не только избежать узких мест, препят­ствующих повышению общей произ­водительности системы, но и не допу­стить излишеств, которые все равно не дадут никакого эффекта. А сэкономлен­ные деньги лучше потратить на улуч­шение очевидных характеристик — объема жесткого диска, оперативной памяти, параметров монитора.

Для наглядности представим прин­ципиальную схему современного ком­пьютера с указанием его узких мест (а точнее, интерфейсов).

узкие места интерфейсов - student2.ru

Рис.1.3 - Узкие места интерфейсов.

На рис.1.3 показаны значения теоре­тически достижимой пиковой пропуск­ной способности различных интер­фейсов и устройств. Серым цветом ука­заны реальные значения этих величин, полученные в ходе замеров на разных системных платах, а цифрами — мес­та, где интерфейсы стыкуются друг с другом.

1. Внутренний кэш снятых ныне с производства процессоров под Socket 7 позволял пропускать до 800 Мбайт/с (на частоте 200 МГц). Сегодняшние процессоры, работа­ющие на частотах свыше 1 ГГц (Pentium III, Celeron, Athlon, Duron), практически не встречают ограни­чений в пропускной способности встроенного кэша благодаря ши­рокой шине и новой архитектуре доступа. Производительность пе­ресылки данных из кэша измеряет­ся десятками Гбайт в секунду.

Вывод: скорость работы встроен­ной кэш-памяти никак не ограни­чивает общую эффективность си­стемы. Скорее можно говорить о недостаточном объеме кэша в не­которых ситуациях.

2. Несколько иная картина наблюда­ется при обмене данными с внеш­ним кэшем на системной плате, хотя такая архитектура уже практи­чески изжила себя и ныне встреча­ется лишь в устаревших системах. Здесь показатели падают до уров­ня нескольких сот Мбайт/с для операций как чтения, так и записи.

Вывод: в системах с кэш-памятью на материнской плате современ­ные ресурсоемкие приложения могут «тормозиться» из-за недоста­точной скорости обмена данными с процессором.

3. В режиме двукратного умножения пиковая пропускная способность шины AGP 1.0 достигает значения 533 Мбайт/с, в режиме четырех­кратного умножения на шине AGP 2.0 достигается производитель­ность 1066 Мбайт/с. Однако увели­чение потребностей приложений в пересылке графических данных потребовало принятие специфи­кации AGP 3.0 (AGP8x), предусмат­ривающей пиковую пропускную способность шины 2132 Мбайт/с. Но такой мощный поток данных, которого за глаза хватает для ны­нешних приложений, пересылает­ся только в одну сторону: от системной шины к видеокарте. Обратно информация передается с пиковым значением скорости 132 Мбайт/с, так как архитектура AGP основана на шине PCI. В версии AGP 3-0 пла­нируется переход на тактовую ча­стоту шины 66 МГц, что позволит вдвое увеличить полосу пропуска­ния и в обратном направлении.

Вывод: верхняя граница пропуск­ной способности шины AGP послед­них модификаций может быть до­стигнута только в режиме моно­польного доступа видеоконтрол­лера к шине памяти, что при ны­нешнем дефиците прерываний на шине PCI представляет неразреши­мую проблему. Поэтому графические устройства компьютера посте­пенно будут переходить на новые системные шины: HyperTransport или 3GIO Arapahoe, по мере их вне­дрения.

4. Реальная скорость обмена с опера­тивной памятью весьма далека от теоретически достижимых значе­ний и зависит в основном от модели чипсета, установленного на си­стемной плате. Для памяти SDRAM пиковые значения достигают 1066 Мбайт/с на частоте 133 МГц, для памяти Rambus DRAM при ис­пользовании четырех каналов до 1600 Мбайт/с, для памяти DDR SDRAM - около 2100 Мбайт/с на эквивалентной частоте 266 МГц. Тестирование современных моде­лей системных плат показывает, что с памятью SDRAM лучше рабо­тает чипсет Intel 815, с памятью DDR SDRAM чипсеты VIA серии 266, ну а альтернативы чипсетам Intel (850) для работы с памятью RDRAM просто нет. Обработка трехмерной графики и видео в ре­жиме реального времени требуют максимальной производительности подсистемы памяти и сбалансиро­ванности пропускной способности с системной шиной. Поэтому про­пускной способности шины памяти для решения ресурсоемких задач никогда не хватает. Видимо, разви­тие этого направления будет по­вторять путь совершенствования видеопамяти за счет роста тактовых частот вплоть до нынешних 66 МГц, как в ультрасовременных моделях видеокарт, и разделения каналов (банков). Хотя не исключено, что на каком-то этапе окажется выгод­ным внедрение новых технологий динамической памяти. Пока же реальная картина интег­рированной пропускной способ­ности шины памяти для современ­ных чипсетов такова:

- nVidia nForce-420 (2 канала по 64 бит DDR SDRAM PC2100) око­ло 820 Мбайт/с;

- VIA KT266A (64 бит DDR SDRAM РС2100) около 800 Мбайт/с;

- VIA KT133A (64 бит SDRAM PC 133) около 950 Мбайт/с.

При чтении данных показатели, конечно выше:

- nVidia nForce-420 (2 канала по 64 бит DDR SDRAM PC2100) око­ло 1650 Мбайт/с;

- VIA КТ266А (64 бит DDR SDRAM РС2100) около 1650 Мбайт/с;

- VIAKT133A(64битSDRAMPC133) около 550 Мбайт/с.

Вывод: недостаточная скорость об­мена с оперативной памятью ста­новится одним из наиболее узких мест компьютерной системы. Пе­реход к модификациям DDR SDRAM и RDRAM лишь на время отодвига­ет границу «терпимости» к этой проблеме, не решая ее по существу.

5. Теоретически достижимая пиковая пропускная способность шины PCI спецификации 2.1 до 132 Мбайт/с сегодня совершенно не удовлетво­ряет потребностей многочислен­ных устройств, подключаемых к данной шине. Первоначально от этого интерфейса «бежали» видео­адаптеры, мигрировавшие на шину AGP. Однако ныне появились и дру­гие устройства, чьи потребности в пересылке данных превышают возможности PCL жесткие диски АТА-100 (АТА-133) и, тем более, Serial ATA, адаптеры Ultra 160 и Ultra320 SCSI, интерфейс USB 2.0, интерфейс IEEE 1394 и многие дру­гие. Спецификация PCI 2.2, преду­сматривающая расширение шины до 64 бит и удвоение тактовой час­тоты, или спецификация PCI-X вряд ли найдут применение в мас­совых компьютерах благодаря вы­сокой стоимости производства. В части обмена данными между контроллерами чипсета (контрол­лер ввода-вывода, или «южный» мост, и контроллер AGP/оператив­ной памяти, или «северный» мост) уже произошел отказ от использования PCI. Однако появление от­дельной шины (V-Link, EV-6) ис­ключительно для связи между эле­ментами чипсета вызывает суще­ственное удорожание системных плат, решая лишь локальную про­блему.

Вывод: шина PCI сегодня становит­ся таким же «бутылочным горлыш­ком» в компьютерной системе, ка­ким был в свое время интерфейс ISA. С учетом широкого внедрения новых внешних (USB, IEEE 1394, 802.lib, Ethernet, Home PNA) и внутренних (Serial ATA, Ultra320 SCSI) интерфейсов переход на дру­гую общесистемную шину ввода-вывода неизбежен в ближайшие годы. Какая архитектура победит (HyperTransport или 3GIO), пока­жет время.

6. Эксперименты показывают, что по обычному 40-жильному кабелю IDE данные проходят со скорос­тью до 16 Мбайт/с. Внедрение 80-жильных шлейфов в специфика­циях АТА-66 и АТА-100 кардинально проблему не решило ввиду внутрен­них ограничений параллельного интерфейса. Учитывая, что скоро­сти внутреннего обмена данными (между буфером и головками) в современных дисках приблизи­лись к порогу пропускной способ­ности шлейфа, данная архитекту­ра стала узком местом в подсисте­мах хранения данных.

Вывод: с ростом емкости и скорос­тей вращения дисков неизбежен переход на интерфейс Serial ATA, что, в свою очередь, потребует и перехода на новую шину ввода-вы­вода вместо устаревшей PCI.

7. Высокоскоростные внешние уст­ройства также требуют повышения пропускной способности шины ввода-вывода. Если суммировать возможный поток данных, посту­пающих на шину PCI от внешних v устройств, он многократно превы­сит пропускную способность ши­ны. Предположим, что к шине PCI подключен сканер (через мост USB-PCI), сетевая карта специфи­кации GigabitEthernet и внешний жесткий диск (через мост IEEE1394-PCI). Очевидно, что одновременное обращение этих устройств к ресурсам компьютер­ной системы в разы замедлит рабо­ту не только друг друга, но и внут­ренних устройств компьютера.

Вывод: до появления высокоскоро­стной внутренней шины ввода-вы­вода не имеет смысла подключать самые производительные внешние устройства, так как обмен данны­ми будет ограничен пропускной способностью шины PCI.

8. В графических адаптерах с геомет­рическим процессором узким ме­стом становится скорость обмена с локальной видеопамятью. В вы­соких разрешениях поток данных превышает 13 Гбайт/с, а пиковая пропускная способность памяти DDR SDRAM при ширине шины 128 бит и частоте 200 МГц состав­ляет всего 6,4 Гбайт/с.

9. Устаревшие интерфейсы последо­вательного (RS-232) и параллель­ного (IEEE 1284) портов, а также их вариации (PS/2, MIDI, Game Port, ИК-порт), ныне являются лишь да­нью традиции. Хотя их возможно­стей вполне хватает низкоскорос­тным устройствам (клавиатура, мышь, джойстик, модем), с целью унификации и удешевления систе­мы необходимо избавляться от этих «окаменелостей». Ничто не мешает все функции переложить на более современный интерфейс, например USB.

РАЗЪЕМЫ ПРОЦЕССОРОВ

Обычно системный набор создается конструкторами с ориентацией на конкретную линейку процессоров. То есть, обеспечивается поддержка опре­деленного процессорного интерфей­са. В это понятие включают тип разъе­ма (механические параметры), его электрические параметры (разводка контактов, напряжение питания ядра и блоков ввода-вывода процессора), воз­можности BIOS по поддержке конкрет­ных моделей процессоров.

Socket7— разъем типа ZIP (Zero Input Force — нулевое усилие установки) с 296 контактами, расположенными в плоском прямоугольном конструктиве. Используется всеми процессорами класса Intel P54/55, AMD К5 и Кб, Cyrix 6x86 и 6х8бМХ, Centaur Technology JDT Сб. Весь обмен данными (в том числе с кэшем) идет по единственной 64-раз­рядной шине. Это послужило одной из основных причин, по которым Intel отказалась от дальнейшего развития интерфейса Socket 7.

Slot 1— разъем с продольно распо­ложенными 242 контактами. Он пред­назначен для установки процессоров (Pentium II/III, Celeron), выполненых в картридже SECC (Single Edge Contac Cartridge — картридж с односторонними контактами). Внутри картриджа размещены кристаллы процессора кэш-памяти (Pentium II/III). В Pentium III Coppermine кэш второго уровня расположен в кристалле процессора. Ши­ны данных и кэша разведены отдельно. Кэш второго уровня может работать на частотах, составляющих 100%, 50% или 33,3% частоты процессора. Кэш L2 в процессорах Celeron либо отсутствует, либо выполнен на одном кристалле с ядром процессора. На материнской плате можно устанавливать до двух разъемов Slot 1.

Socket 370— интерфейс для процес­соров серии Celeron. Отличается от Slot 1 размещением контактов на плос­кой площадке (по типу Socket 7). Элект­рические и логические параметры пол­ностью совпадают с разъемом Slot 1. Для подключения к новому интерфей­су годятся только процессоры в пласт­массовом корпусе типа PPGA (Plastic Pin Grid Array). Однако возможна об­ратная совместимость — поставляются переходники для установки процессо­ров в корпусах PPGA в разъем Slot 1.

FC-PGA 370— интерфейс для про­цессоров Celeron и Pentium III (ядро Coppermine) в корпусах Flip Chip PGA с пониженным напряжением питания ядра. Физически совпадает с Socket 370, однако электрически с ним не совмес­тим. В частности, изменено назначение Контактов, использованы другие напряжения питания. Существуют адап­теры (переходники) FC-PGA/Slot 1, но поддержка новых процессоров должна обеспечиваться BIOS и регулятором на­пряжения системной платы.

Socket 423— плоский штырьковый разъем для нового 32-разрядного про­цессора седьмого поколения Pentium 4 фирмы Intel.

Socket 478 - плоский штырьковый разъем для процессора Pentium 4 с яд­ром Northwood. Для его поддержки требуются модифицированные чипсеты (например, Intel 815 Step В).

Slot A— разъем с продольно распо­ложенными 242-мя контактами для процессора Athlon (в картридже) фир­мы AMD. Обеспечивает поддержку си­стемной шины EV-6.

Socket A —разъем с плоской контакт­ной площадкой (462 контакта) для про­цессоров Athlon/Duron с ядром Thunderbird в пластиковом корпусе PGA и кэш-памятью второго уровня на одном кристалле с процессором.

Socket 754 - плоский разъем для процессора AMD Sempron , AMD Athlon 64

Socket 939 - плоский разъем для процессора AMD Sempron, AMD Athlon 64, AMD Opteron

Socket 775 - плоский разъем для процессора Pentium 4 и Celeron.

Наши рекомендации