Узкие места интерфейсов
При планировании конфигурации своего компьютера постарайтесь не только избежать узких мест, препятствующих повышению общей производительности системы, но и не допустить излишеств, которые все равно не дадут никакого эффекта. А сэкономленные деньги лучше потратить на улучшение очевидных характеристик — объема жесткого диска, оперативной памяти, параметров монитора.
Для наглядности представим принципиальную схему современного компьютера с указанием его узких мест (а точнее, интерфейсов).
Рис.1.3 - Узкие места интерфейсов.
На рис.1.3 показаны значения теоретически достижимой пиковой пропускной способности различных интерфейсов и устройств. Серым цветом указаны реальные значения этих величин, полученные в ходе замеров на разных системных платах, а цифрами — места, где интерфейсы стыкуются друг с другом.
1. Внутренний кэш снятых ныне с производства процессоров под Socket 7 позволял пропускать до 800 Мбайт/с (на частоте 200 МГц). Сегодняшние процессоры, работающие на частотах свыше 1 ГГц (Pentium III, Celeron, Athlon, Duron), практически не встречают ограничений в пропускной способности встроенного кэша благодаря широкой шине и новой архитектуре доступа. Производительность пересылки данных из кэша измеряется десятками Гбайт в секунду.
Вывод: скорость работы встроенной кэш-памяти никак не ограничивает общую эффективность системы. Скорее можно говорить о недостаточном объеме кэша в некоторых ситуациях.
2. Несколько иная картина наблюдается при обмене данными с внешним кэшем на системной плате, хотя такая архитектура уже практически изжила себя и ныне встречается лишь в устаревших системах. Здесь показатели падают до уровня нескольких сот Мбайт/с для операций как чтения, так и записи.
Вывод: в системах с кэш-памятью на материнской плате современные ресурсоемкие приложения могут «тормозиться» из-за недостаточной скорости обмена данными с процессором.
3. В режиме двукратного умножения пиковая пропускная способность шины AGP 1.0 достигает значения 533 Мбайт/с, в режиме четырехкратного умножения на шине AGP 2.0 достигается производительность 1066 Мбайт/с. Однако увеличение потребностей приложений в пересылке графических данных потребовало принятие спецификации AGP 3.0 (AGP8x), предусматривающей пиковую пропускную способность шины 2132 Мбайт/с. Но такой мощный поток данных, которого за глаза хватает для нынешних приложений, пересылается только в одну сторону: от системной шины к видеокарте. Обратно информация передается с пиковым значением скорости 132 Мбайт/с, так как архитектура AGP основана на шине PCI. В версии AGP 3-0 планируется переход на тактовую частоту шины 66 МГц, что позволит вдвое увеличить полосу пропускания и в обратном направлении.
Вывод: верхняя граница пропускной способности шины AGP последних модификаций может быть достигнута только в режиме монопольного доступа видеоконтроллера к шине памяти, что при нынешнем дефиците прерываний на шине PCI представляет неразрешимую проблему. Поэтому графические устройства компьютера постепенно будут переходить на новые системные шины: HyperTransport или 3GIO Arapahoe, по мере их внедрения.
4. Реальная скорость обмена с оперативной памятью весьма далека от теоретически достижимых значений и зависит в основном от модели чипсета, установленного на системной плате. Для памяти SDRAM пиковые значения достигают 1066 Мбайт/с на частоте 133 МГц, для памяти Rambus DRAM при использовании четырех каналов до 1600 Мбайт/с, для памяти DDR SDRAM - около 2100 Мбайт/с на эквивалентной частоте 266 МГц. Тестирование современных моделей системных плат показывает, что с памятью SDRAM лучше работает чипсет Intel 815, с памятью DDR SDRAM чипсеты VIA серии 266, ну а альтернативы чипсетам Intel (850) для работы с памятью RDRAM просто нет. Обработка трехмерной графики и видео в режиме реального времени требуют максимальной производительности подсистемы памяти и сбалансированности пропускной способности с системной шиной. Поэтому пропускной способности шины памяти для решения ресурсоемких задач никогда не хватает. Видимо, развитие этого направления будет повторять путь совершенствования видеопамяти за счет роста тактовых частот вплоть до нынешних 66 МГц, как в ультрасовременных моделях видеокарт, и разделения каналов (банков). Хотя не исключено, что на каком-то этапе окажется выгодным внедрение новых технологий динамической памяти. Пока же реальная картина интегрированной пропускной способности шины памяти для современных чипсетов такова:
- nVidia nForce-420 (2 канала по 64 бит DDR SDRAM PC2100) около 820 Мбайт/с;
- VIA KT266A (64 бит DDR SDRAM РС2100) около 800 Мбайт/с;
- VIA KT133A (64 бит SDRAM PC 133) около 950 Мбайт/с.
При чтении данных показатели, конечно выше:
- nVidia nForce-420 (2 канала по 64 бит DDR SDRAM PC2100) около 1650 Мбайт/с;
- VIA КТ266А (64 бит DDR SDRAM РС2100) около 1650 Мбайт/с;
- VIAKT133A(64битSDRAMPC133) около 550 Мбайт/с.
Вывод: недостаточная скорость обмена с оперативной памятью становится одним из наиболее узких мест компьютерной системы. Переход к модификациям DDR SDRAM и RDRAM лишь на время отодвигает границу «терпимости» к этой проблеме, не решая ее по существу.
5. Теоретически достижимая пиковая пропускная способность шины PCI спецификации 2.1 до 132 Мбайт/с сегодня совершенно не удовлетворяет потребностей многочисленных устройств, подключаемых к данной шине. Первоначально от этого интерфейса «бежали» видеоадаптеры, мигрировавшие на шину AGP. Однако ныне появились и другие устройства, чьи потребности в пересылке данных превышают возможности PCL жесткие диски АТА-100 (АТА-133) и, тем более, Serial ATA, адаптеры Ultra 160 и Ultra320 SCSI, интерфейс USB 2.0, интерфейс IEEE 1394 и многие другие. Спецификация PCI 2.2, предусматривающая расширение шины до 64 бит и удвоение тактовой частоты, или спецификация PCI-X вряд ли найдут применение в массовых компьютерах благодаря высокой стоимости производства. В части обмена данными между контроллерами чипсета (контроллер ввода-вывода, или «южный» мост, и контроллер AGP/оперативной памяти, или «северный» мост) уже произошел отказ от использования PCI. Однако появление отдельной шины (V-Link, EV-6) исключительно для связи между элементами чипсета вызывает существенное удорожание системных плат, решая лишь локальную проблему.
Вывод: шина PCI сегодня становится таким же «бутылочным горлышком» в компьютерной системе, каким был в свое время интерфейс ISA. С учетом широкого внедрения новых внешних (USB, IEEE 1394, 802.lib, Ethernet, Home PNA) и внутренних (Serial ATA, Ultra320 SCSI) интерфейсов переход на другую общесистемную шину ввода-вывода неизбежен в ближайшие годы. Какая архитектура победит (HyperTransport или 3GIO), покажет время.
6. Эксперименты показывают, что по обычному 40-жильному кабелю IDE данные проходят со скоростью до 16 Мбайт/с. Внедрение 80-жильных шлейфов в спецификациях АТА-66 и АТА-100 кардинально проблему не решило ввиду внутренних ограничений параллельного интерфейса. Учитывая, что скорости внутреннего обмена данными (между буфером и головками) в современных дисках приблизились к порогу пропускной способности шлейфа, данная архитектура стала узком местом в подсистемах хранения данных.
Вывод: с ростом емкости и скоростей вращения дисков неизбежен переход на интерфейс Serial ATA, что, в свою очередь, потребует и перехода на новую шину ввода-вывода вместо устаревшей PCI.
7. Высокоскоростные внешние устройства также требуют повышения пропускной способности шины ввода-вывода. Если суммировать возможный поток данных, поступающих на шину PCI от внешних v устройств, он многократно превысит пропускную способность шины. Предположим, что к шине PCI подключен сканер (через мост USB-PCI), сетевая карта спецификации GigabitEthernet и внешний жесткий диск (через мост IEEE1394-PCI). Очевидно, что одновременное обращение этих устройств к ресурсам компьютерной системы в разы замедлит работу не только друг друга, но и внутренних устройств компьютера.
Вывод: до появления высокоскоростной внутренней шины ввода-вывода не имеет смысла подключать самые производительные внешние устройства, так как обмен данными будет ограничен пропускной способностью шины PCI.
8. В графических адаптерах с геометрическим процессором узким местом становится скорость обмена с локальной видеопамятью. В высоких разрешениях поток данных превышает 13 Гбайт/с, а пиковая пропускная способность памяти DDR SDRAM при ширине шины 128 бит и частоте 200 МГц составляет всего 6,4 Гбайт/с.
9. Устаревшие интерфейсы последовательного (RS-232) и параллельного (IEEE 1284) портов, а также их вариации (PS/2, MIDI, Game Port, ИК-порт), ныне являются лишь данью традиции. Хотя их возможностей вполне хватает низкоскоростным устройствам (клавиатура, мышь, джойстик, модем), с целью унификации и удешевления системы необходимо избавляться от этих «окаменелостей». Ничто не мешает все функции переложить на более современный интерфейс, например USB.
РАЗЪЕМЫ ПРОЦЕССОРОВ
Обычно системный набор создается конструкторами с ориентацией на конкретную линейку процессоров. То есть, обеспечивается поддержка определенного процессорного интерфейса. В это понятие включают тип разъема (механические параметры), его электрические параметры (разводка контактов, напряжение питания ядра и блоков ввода-вывода процессора), возможности BIOS по поддержке конкретных моделей процессоров.
Socket7— разъем типа ZIP (Zero Input Force — нулевое усилие установки) с 296 контактами, расположенными в плоском прямоугольном конструктиве. Используется всеми процессорами класса Intel P54/55, AMD К5 и Кб, Cyrix 6x86 и 6х8бМХ, Centaur Technology JDT Сб. Весь обмен данными (в том числе с кэшем) идет по единственной 64-разрядной шине. Это послужило одной из основных причин, по которым Intel отказалась от дальнейшего развития интерфейса Socket 7.
Slot 1— разъем с продольно расположенными 242 контактами. Он предназначен для установки процессоров (Pentium II/III, Celeron), выполненых в картридже SECC (Single Edge Contac Cartridge — картридж с односторонними контактами). Внутри картриджа размещены кристаллы процессора кэш-памяти (Pentium II/III). В Pentium III Coppermine кэш второго уровня расположен в кристалле процессора. Шины данных и кэша разведены отдельно. Кэш второго уровня может работать на частотах, составляющих 100%, 50% или 33,3% частоты процессора. Кэш L2 в процессорах Celeron либо отсутствует, либо выполнен на одном кристалле с ядром процессора. На материнской плате можно устанавливать до двух разъемов Slot 1.
Socket 370— интерфейс для процессоров серии Celeron. Отличается от Slot 1 размещением контактов на плоской площадке (по типу Socket 7). Электрические и логические параметры полностью совпадают с разъемом Slot 1. Для подключения к новому интерфейсу годятся только процессоры в пластмассовом корпусе типа PPGA (Plastic Pin Grid Array). Однако возможна обратная совместимость — поставляются переходники для установки процессоров в корпусах PPGA в разъем Slot 1.
FC-PGA 370— интерфейс для процессоров Celeron и Pentium III (ядро Coppermine) в корпусах Flip Chip PGA с пониженным напряжением питания ядра. Физически совпадает с Socket 370, однако электрически с ним не совместим. В частности, изменено назначение Контактов, использованы другие напряжения питания. Существуют адаптеры (переходники) FC-PGA/Slot 1, но поддержка новых процессоров должна обеспечиваться BIOS и регулятором напряжения системной платы.
Socket 423— плоский штырьковый разъем для нового 32-разрядного процессора седьмого поколения Pentium 4 фирмы Intel.
Socket 478 - плоский штырьковый разъем для процессора Pentium 4 с ядром Northwood. Для его поддержки требуются модифицированные чипсеты (например, Intel 815 Step В).
Slot A— разъем с продольно расположенными 242-мя контактами для процессора Athlon (в картридже) фирмы AMD. Обеспечивает поддержку системной шины EV-6.
Socket A —разъем с плоской контактной площадкой (462 контакта) для процессоров Athlon/Duron с ядром Thunderbird в пластиковом корпусе PGA и кэш-памятью второго уровня на одном кристалле с процессором.
Socket 754 - плоский разъем для процессора AMD Sempron , AMD Athlon 64
Socket 939 - плоский разъем для процессора AMD Sempron, AMD Athlon 64, AMD Opteron
Socket 775 - плоский разъем для процессора Pentium 4 и Celeron.