ВЫЧИСЛИТEЛЬНЫ СИСТEМЫ СEТИ И ТEЛEКОММУНИКАЦИИ 3

32
32
32
150-200
233-600
450 –
1400
66
66-100
100 –
133
8+8
16+16
16+16

256
512
256/
512
0,35
0,250,180,13
5,5
7,5
10 –
40

7
AMD Athlon

Intel
Pentium 4
1999

2000 32

32 500 –
2200

1300 –
3400
200 –
400

400 –
800 64+64

8+12 K оп.
256/
512

256/
512
0,180,13

0,180,13
22 –
54

42 –
55

Отметим, что корпорациями Intel и AMD при производстве процессоров Celeron и Duron для компьютеров нижнего ценового диапазона за основу берутся сложные базовые модели процессоров, производительность которых искусственно снижается. Однако такой важный параметр, как тепловыделение, остается практически на прежнем уровне. В результате требуются почти такие же затраты на охлаждение (а соответственно и необходимость установки мощных и шумных охлаждающих вентиляторов), как и высокопроизводительных «старших» моделей процессоров. Фирма VIA реализует свою идеологию создания процессоров для сегмента малопроизводительных недорогих компьютеров, которая заключается в достижении приемлемого (для систем низшего класса) уровня производительности минимальными средствами с отказом от дорогостоящих решений, рассчитанных на принципиально другой, более высокий уровень производительности. При этом архитектура процессора оптимизируется с целью минимизации количества транзисторов и площади кристалла, что позволяет уменьшить как энергопотребление, так и стоимость. В 2003 году был представлен процессор VIA С3, разработанный с учетом указанных принципов минимизации. Процессор VIA С3 с частотой 1ГГц построен на 0,13-мкм ядре Ezra-T, имеет 128 Кбайт кэш-памяти первого уровня и 64 Кбайт – второго. Число транзисторов – 15,8 млн, площадь кристалла – всего 52 мм2, а потребляемая мощность – 12 Вт. Благодаря небольшой площади кристалла процессор имеет вполне конкурентоспособную цену, а при такой малой мощности можно при объемном радиаторе обойтись без охлаждающего вентилятора, снизив тем самым уровень шума и потребляемой энергии.
В 2004 году основным модельным рядом AMD для настольных компьютеров стало семейство процессоров Athlon 64. Помимо эффективной архитектуры, позволяющей процессорам Athlon 64 показывать высокий уровень быстродействия при сравнительно небольших тактовых частотах, эти процессоры обладают и некоторыми другими достоинствами. Например, в Athlon 64 реализована технология Cool’n’Quiet, позволяющая снижать частоту работы процессора в моменты его неполной загрузки, а соответственно снижать его тепловыделение и энергопотребление. Кроме того, процессор оснащен средствами Enhanced Virus Protection, защищающими ПК от вирусных программ. При использовании 0,13-мкм и 0,09-мкм техпроцессов Athlon 64 имеет частоты 2,2 – 2,4 ГГц. Процессоры Athlon 64 выпускаются на базе трех различных ядер: ClawHammer, NewCastle и Winchester. У ядра ClawHammer, исторически ставшего первым процессорным ядром Athlon 64, объем кэш-памяти второго уровня составляет 1 Мбайт. Ядро NewCastle, спроектированное AMD позднее, обладает вдвое меньшим объемом кэш-памяти второго уровня – 512 Кбайт. Оба ядра изготавливаются по 0,13-мкм технологическому процессу. Более же совершенная технология с 0,09-мкм проектными нормами используется при изготовлении ядра Winchester (кэш-память второго уровня – 512 Кбайт). Заметим, что наличие в процессорах AMD технологии AMD64 никоим образом не уменьшает ни функциональности, ни производительности этих продуктов в привычных 32-битных режимах.
Процессоры AMD Athlon 64 FX являются еще одной модификацией Athlon 64, которая предназначена для пользователей, стремящихся добиться максимальной производительности своей вычислительной машины. Фактически Athlon 64 FX построен на той же самой микроархитектуре, что и обычный Athlon 64. Однако благодаря ряду новых решений его производительность (а соответственно и цена) выше. В отличие от обычных Athlon 64, коэффициент умножения в нем не зафиксирован, что делает возможным увеличение частоты ядра процессора без увеличения частоты тактового генератора.
В 2004 году корпорация AMD также предложила новое семейство процессоров для недорогих компьютеров, получившее название Sempron. Эти процессоры фактически представляют собой переименованные процессоры Athlon XP. Модельный ряд процессоров Sempron с рейтингами до 2800+ составляют процессоры с частотой шины 333 МГц, частотами ядра до 2 ГГц и объемом кэш-памяти второго уровня объемом 256 Кбайт. Sempron 3000+ – это процессор на ядре Barton с частотой 2 ГГц, 333-МГц шиной и кэш-памятью второго уровня объемом 512 Кбайт.
В 2004 году продолжилось и развитие процессоров семейства Pentium 4. С переходом на 0,09-мкм технологический процесс корпорация Intel разработала новое процессорное ядро, получившее название Prescott, которое, как и его предшественники Willamette и Northwood, основано на архитектуре NetBurst. Основная идея этой архитектуры – достижение высокой производительности благодаря функционированию процессора на высокой тактовой частоте. В Prescott по сравнению с предшествующими ядрами архитектура NetBurst несколько усовершенствована. Так, в Prescott удлинен исполнительный конвейер до 31 ступени. При этом частоты Pentium 4 на ядре Prescott к 2005 году достигли 3,8 ГГц (для сравнения укажем, что в процессоре Pentium III с 0,13-мкм ядром Taulatin и конвейером с 10 стадиями максимальная частота превысила 1,5 ГГц, а в процессоре Pentium 4 с 0,13-мкм ядром Northwood и конвейером с 20 стадиями максимальная частота достигла 3 ГГц и выше). Для того чтобы производительность процессоров на новом ядре Prescott на одинаковых частотах с Northwood не снизилась, в процессорах на ядрах Prescott увеличена кэш-память второго уровня с 512 Кбайт до 1 Мбайт, а кэш-память первого уровня для данных – с 8 Кбайт до 16 Кбайт. Размер же кэш-памяти для инструкций остался неизменным: он способен вместить 12 000 микроинструкций (микроопераций или микрокоманд), что примерно эквивалентно объему в 8 –16 Кбайт.
В ядре Prescott усовершенствовано предсказание ветвлений – основной метод борьбы с простоями процессора, вызванными необходимостью очистки и повторного заполнения длинного конвейера после неправильно предсказанных переходов. Работа блока предсказания переходов, применяющегося в процессорах с NetBurst-архитектурой, основывается на использовании буфера, в котором накапливается статистика выполненных переходов. То есть, для предсказания переходов используется вероятностная модель – преимущественным направлением перехода процессор считает то направление, которое наиболее вероятно согласно накопленным статистическим данным. Этот алгоритм очень неплохо проявил себя на практике, однако он совершенно бесполезен в случае отсутствия статистики по конкретному переходу. Процессоры на ядре Northwood в этом случае всегда выбирали направление перехода «назад», вполне обоснованно считая, что самые распространенные условные переходы – это условия продолжения циклов. В Prescott эта статическая схема предсказания переходов была существенно доработана. Теперь, если по встретившемуся переходу статистика отсутствует, модуль предсказания перехода не делает однозначного вывода о его направлении, а основывает свое решение на анализе расстояния, на которое совершается переход, поскольку обратные переходы в циклах редко совершаются за некую эмпирически найденную границу. Кроме того, была усовершенствована и схема динамического предсказания переходов. В результате, если у процессоров на ядре Northwood число неправильно предсказанных переходов в среднем составляло 0,86 на 100 инструкций, то теперь эта величина – 0,75 неправильных переходов на 100 инструкций. Иными словами, количество неправильно предсказанных переходов снизилось на 12%.
Второе улучшение, реализованное в Prescott, – ускоренное исполнение некоторых команд. Несмотря на то, что количество целочисленных АЛУ в процессоре осталось прежним – два для простых инструкций, работающих на удвоенной частоте ядра, и одно для сложных инструкций, – скорость исполнения отдельных команд в Prescott возросла. Связано это с некоторыми изменениями в архитектуре АЛУ. Так, в одно из двух «быстрых» АЛУ был добавлен блок обычного циклического сдвига. Теперь такие инструкции исполняются быстрее, поскольку в предыдущих реализациях Pentium 4 сдвиги трактовались как сложные инструкции и выполнялись на «медленном» АЛУ. Также гораздо быстрее в процессорах на ядре Prescott выполняются операции целочисленного умножения. В предыдущих реализациях NetBurst целочисленное умножение выполнялось блоком FPU с предварительным переводом операндов сначала в формат с плавающей точкой, а потом обратно. В Prescott же операции целочисленного умножения стали выполняться целочисленным АЛУ, что ощутимо снизило время их выполнения. Так, скорость выполнения сдвигов возросла по меньшей мере в четыре раза, а целочисленные умножения стали выполняться примерно на 25% быстрее.
Третье усовершенствование NetBurst в Prescott – оптимизация алгоритма предварительной выборки данных. Она призвана уменьшить отрицательный эффект от ситуаций, когда в кэш-памяти процессора отсутствуют данные для обработки. Усовершенствования затрагивают как программную предвыборку, инициируемую работающей программой, так и аппаратную предвыборку.
Еще одно новшество ядра Prescott – это модернизация технологии Hyper-Threading за счет увеличения количества эксклюзивных ресурсов процессора для каждого потока, внедрения двух новых специальных инструкций для управления несколькими потоками и возможности в Prescott распараллеливать некоторые процессы, которые в Northwood могли выполняться только по одному (в частности, это касается одновременной работы потоков с кэш-памятью). В ядре Prescott доработан набор SIMD-инструкций, получивший наименование SSE3 и содержащий 13 новых инструкций. Расширилась и функциональность процессоров Pentium 4. Процессоры Pentium 4 на ядре Prescott совместимы с технологией EM64T (Intel Extended Memory 64 Technology), практически полностью идентичной 64-битным расширениям AMD64. Intel реализовала технологию Execute Disable Bit, аналогичную Enhanced Virus Protection корпорации AMD, и начинает снабжать свои процессоры семейства Pentium 4 средствами Intel Enhanced SpeedStep, подобными Cool’n’Quiet от AMD.
Кроме обычных процессоров Pentium 4, среди предложений Intel есть и процессор Pentium 4 Extreme Edition, позиционирование которого сходно с позиционированием Athlon 64 FX корпорации AMD: этот процессор ориентирован на самых требовательных пользователей. Pentium 4 Extreme Edition с частотой 3,46 ГГц выполнен на ядре Gallatin с 0,13-мкм техпроцессом, построенном, в свою очередь, на базе ядра Northwood. Основное отличие Pentium 4 Extreme Edition от обычных процессоров Pentium 4 на ядре Northwood – наличие кэш-памяти третьего уровня объемом 2 Мбайт и использование 1066-МГц системной шины.
К 2005 году на смену традиционным массовым процессорам Celeron пришли процессоры семейства Celeron D с ядром Prescott. Благодаря новому ядру процессоры Celeron D приобрели увеличенную до 256 Кбайт кэш-память второго уровня, 533-МГц системную шину и совместимость с набором инструкций SSE3. Эти изменения заметно повысили производительность процессоров Celeron D по сравнению с предыдущим семейством Celeron, благодаря чему они стали достаточно удачным выбором с точки зрения соотношения цена/производительность.
Хотя доминирующее положение на рынке ПК занимают процессоры с архитектурой «x86», следует отметить разработку достаточно прогрессивного процессора для менее распространенного семейства компьютеров Macintosh фирмы Apple. Такой разработкой стал 64-разрядный RISC-процессор IBM PowerPC 970, именуемый фирмой Apple как PowerPC G5. Процессор PowerPC G5 – это дальнейшее развитие довольно успешного предшественника – Power4. Однако если Power4 предназначался для серверов и высокопроизводительных рабочих станций, то PowerPC G5 ориентирован на настольные ПК. В новом процессоре отсутствует кэш-память третьего уровня. При разработке этого процессора существенное внимание было уделено скорости работы с потоковыми данными, вследствие чего значительно изменилась системная шина этого процессора. PowerPC G5 изготавливается на производственных мощностях IBM с применением техпроцесса 0,13-мкм. Конвейер PowerPC G5, как и конвейеры процессоров AMD, относительно невелик и состоит из десяти ступеней.
Корпорация IBM решила не отказываться от полной обратной совместимости со старыми 32-разрядными приложениями. Это позволяет использовать на компьютерах серии Apple PowerMac G5 как старые 32-разрядные, так и новые 64-разрядные операционные системы MacOS и приложения. Увеличение же разрядности регистров процессора повлекло за собой рост доступного для процессора адресного пространства до 4 Тбайт. В рассматриваемом процессоре объем кэш-памяти второго уровня составляет 512 Кбайт, кэш-память первого уровня имеет 64 Кбайт для инструкций и 32 Кбайт для данных. При этом по пропускной способности и латентности кэш-память PowerPC G5 не уступают кэш-памяти Pentium 4.
К настоящему времени ведущими разработчиками и изготовителями современных процессоров для класса персональных компьютеров клона IBM PC являются корпорации Intel (примерно 82% рынка) и AMD (около 17% рынка). Очень незначительная часть (менее 1%) приходится на долю фирм VIA (C3) и Transmeta (Crusoe). От проникновения других архитектур этот рынок надежно защищен гигантским объемом программного обеспечения, ориентированного на архитектуру x86. Однако можно утверждать, что причины столь внушительного превосходства Intel носят главным образом не технологический, а исторический и маркетинговый характер.
Ведущие производители процессоров в последнее время четко позиционируют свои изделия по классам компьютеров, для которых эти процессоры предназначаются. Поэтому далее отдельно рассмотрим характеристики процессоров для портативных мобильных компьютеров и процессоров для высокопроизводительных вычислительных машин и систем.
2.4. Процессоры для портативных мобильных компьютеров

Портативные мобильные компьютеры («ноутбуки») становятся все более популярным классом ПК. К 2005 году доля ноутбуков в общих продажах компьютеров составила около 30%, и эта доля имеет явную тенденцию к интенсивному росту. Популярность ноутбуков связана с постоянным снижением цен на компьютеры такого класса и все более широким распространение беспроводных сетей, что делает использование портативных мобильных компьютеров более удобным по сравнению с настольными машинами. Поэтому в модельных рядах ведущих изготовителей процессоров все более заметное место занимают процессоры для ноутбуков.
Создание процессоров для мобильных ПК имеет свою специфику. Помимо высокой производительности, такие процессоры должны быть экономичными с точки зрения энергопотребления, так как для ноутбука размеры, масса и время автономной работы – чрезвычайно важные параметры, часто не менее важные, чем производительность. На эти характеристики архитектура применяемого центрального процессора влияет весьма значительно.
Процессоры для мобильных ПК, характеризующиеся меньшим тепловыделением и энергопотреблением, обладают большей степенью мобильности, поскольку низкое энергопотребление позволяет либо увеличить время работы компьютера от стандартной батареи, либо уменьшить ее массу и размеры при сохранении приемлемого времени автономной работы, а низкое тепловыделение дает возможность ограничиться легкой и компактной системой охлаждения. Поэтому процессоры для портативных мобильных компьютеров должны в той или иной степени отличаться от процессоров, устанавливаемых в настольные ПК.
Следует заметить, что, помимо создания специальных «мобильных» архитектур процессоров, возможен и другой подход, позволяющий предложить конкурентноспособные решения процессоров для ноутбуков. Такие процессоры можно получить, понижая энергопотребление обычных массовых процессоров для настольных ПК. Снижение энергопотребления процессора до уровня, приемлемого для ноутбуков, достигается уменьшением тактовой частоты и напряжения питания процессора. Известно, что энергопотребление процессора линейно зависит от частоты и квадратично от напряжения питания процессора. Оперируя этими двумя характеристиками, можно добиться относительно высокой экономичности. Однако лучшим сочетанием характеристик, естественно, будут обладать все же процессоры, целенаправленно разработанные для использования в мобильных компьютерах, а не адаптированные варианты «настольных» процессоров.
Ситуация на рынке процессоров для портативных мобильных компьютеров до некоторых пор во многом определялась положением дел на рынке центральных процессоров для настольных ПК.
Корпорациями AMD и Intel для мобильных компьютеров предлагались те же самые процессоры с добавлением в них лишь технологии энергосбережения. При этом использование мобильного аналога высокопроизводительного процессора Pentium 4 – его модификации Pentium 4-М – с длинным конвейером и чрезвычайно высокими тактовыми частотами приводит к достаточно большому потреблению энергии, а поэтому возможно лишь в относительно тяжелых и громоздких переносных компьютерах. Именно поэтому Intel предложила новый мобильный процессор Pentium М со специализированной архитектурой. Базой для разработки Pentium М была выбрана архитектура предыдущего поколения процессоров Pentium III, однако для увеличения тактовой частоты конвейер в Pentium М удлинен по сравнению с конвейером Pentium III, кэш-память первого уровня расширена до 64 Кбайт, второго уровня – до 1 – 2 Мбайт. Кроме того, добавлена реализация набора инструкций SSE2. Pentium М обладает усовершенствованным блоком предсказания переходов и поддерживает специальные технологии, призванные обеспечивать более рациональное использование ресурсов с точки зрения уменьшения энергопотребления. Pentium М имеет относительно невысокое тепловыделение, поскольку многие его блоки при отсутствии обращений к ним просто отключаются или переходят в состояние ожидания.
Процессоры семейства Pentium M на ядре Banias с 0,13-мкм техпроцессом рассчитаны на тактовые частоты от 1,3 до 1,7 ГГц и 400-МГц системную шину, их энергопотребление не превышает 24 Вт. Pentium M на ядре Dothan с 0,09-мкм техпроцессом имеют вдвое большую кэш-память второго уровня (2 Мбайт), тактовые частоты от 1,5 до 2 ГГц, 400-МГц системную шину и энергопотребление не более 21 Вт. Все процессоры семейства Pentium M оснащены средствами Enhanced Intel SpeedStep. Благодаря этой технологии программное обеспечение ноутбука получает контроль над множителем тактовой частоты ЦП, что используется для ее понижения в моменты неполной загрузки процессора вплоть до 600 МГц. При этом время работы ноутбука от батарей заметно повышается, поскольку энергопотребление Pentium M в экономичном режиме снижается до 6–8 Вт.
Корпорация AMD противопоставила модельному ряду Pentium M корпорации Intel свои процессоры семейства Mobile Athlon 64 и Turion 64. Эти процессоры имеют архитектуру, полностью аналогичную архитектуре «настольных» моделей Athlon 64. Процессоры Turion 64 совместимы с 64-битными расширениями AMD64. Модельный ряд Turion 64 представлен, во-первых, процессорами с кэш-памятью второго уровня объемом 1 Мбайт, которые имеют частоты от 1,6 до 2,2 ГГц и энергопотребление до 60 Вт, во-вторых, процессорами с вдвое меньшей кэш-памятью второго уровня (512 Кбайт), которые имеют частоты от 1,6 до 2,0 ГГц и энергопотребление до 35 Вт. Для снижения энергопотребления в этих процессорах применена фирменная технология PowerNow!, по сути аналогичная технологиям Cool’n’Quiet и Intel Enhanced SpeedStep. Программное обеспечение ноутбука также имеет возможность управления коэффициентом умножения частоты процессора, благодаря чему частота может быть снижена до 800 МГц, а энергопотребление процессора при этом составляет около 12 Вт.
Для суперпортативных мобильных компьютеров (субноутбуков и мининоутбуков) Intel предлагает специальные классы процессоров: Low Voltage Pentium M и Ultra Low Voltage Pentium M. Эти процессоры благодаря пониженному напряжению питания и уменьшенной тактовой частоте имеют гораздо более низкие энергопотребление и тепловыделение. Так, у процессоров Low Voltage Pentium M на ядре Dothan тактовая частота 1,4 – 1,5 ГГц и максимальное энергопотребление 10 Вт. Класс процессоров Ultra Low Voltage Pentium M еще более экономичен: такие процессоры на ядре Dothan имеют тактовые частоты 1,0 – 1,2 ГГц и энергопотребление, не превышающее 5 Вт. Напряжение питания этих процессоров составляет всего 0,96–1,05 В.
Для рынка недорогих ноутбуков корпорация Intel предлагает семейство процессоров Celeron M, представляющих собой упрощенные версии процессоров Pentium M. Celeron M с ядром Dothan работает на частотах от 1,3 до 1,5 ГГц, имеет кэш-память второго уровня объемом 1 Мбайт, частоту системной шины – 400 МГц, энергопотребление – до 21 Вт. У Celeron M отсутствует технология Enhanced Intel SpeedStep, поэтому Celeron M менее экономичен, чем Pentium M. Помимо обычных Celeron M корпорацией Intel разработано семейство процессоров Ultra Low Voltage Celeron M, предназначенных для ультракомпактных ноутбуков. Эти процессоры имеют частоты 0,9 и 1,0 ГГц. Пониженные частоты и невысокое напряжение питания позволяют этим процессорам иметь энергопотребление всего 5 Вт.
Семейство процессоров AMD Mobile Sempron представляет собой упрощенные и удешевленные версии процессоров Mobile Athlon 64 и Turion 64. Такие процессоры на ядре Sonora укладываются в рамки энергопотребления до 25 Вт, имеют тактовые частоты 1,6 и 1,8 ГГц, кэш-память второго уровня объемом 128 – 256 Кбайт, работают с 800-МГц системной шиной HyperTransport. Процессоры Mobile Sempron оснащены фирменными средствами энергосбережения – технологией PowerNow!, позволяющей понижать тактовую частоту в моменты неполной загрузки.

2.5. Процессоры для высокопроизводительных
вычислительных машин и систем

В сфере разработки и применения процессоров для высокопроизводительных вычислительных машин и систем в последние годы произошли значительные стратегические изменения. До середины 1980-х годов высокопроизводительные вычислительные машины и системы (МВК, суперкомпьютеры) создавались как единичные экземпляры специализированного назначения, для которых проектировались уникальные архитектуры дорогостоящих многокомпонентных векторно-конвейерных процессоров, собираемых из большого количества микросхем. К настоящему времени высокопроизводительные вычислительные машины и системы переходят в разряд серийно выпускаемых и относительно широко востребуемых изделий. Поэтому разработчикам таких систем экономически целесообразнее использовать в своей продукции серийно выпускаемые микроэлектронные компоненты, тем более что прогресс в их характеристиках и производстве превратил микропроцессоры, микросхемы памяти и адаптеры внешних устройств со стандартными интерфейсами в доступные и эффективные устройства. В свою очередь применение серийных компонентов позволило относительно легко масштабировать МВК до значительного числа процессоров (см. раздел 13). Ориентация на массовый рынок изделий микроэлектроники, выпуск которых достаточно хорошо освоен промышленностью, также дает возможность значительно сократить сроки и стоимость производства МВК, сконцентрировав при этом основные усилия на совершенствовании и разработке новых архитектурных решений вычислительных комплексов в целом.
На рынке процессоров для высокопроизводительных вычислительных машин и систем (особенно в сегменте самых мощных из них) до последнего времени преобладали традиционные для этой сферы применения процессоры, такие как Alpha корпорации DEC, UltraSPARC корпорации Sun Microsystems, PA-RISC корпорации Hewlett-Packard, Power корпорации IBM, MIPS корпорации SGL. Однако лидирующие позиции на нем начинают занимать производители х86-процессоров, которым удалось практически полностью занять средний и нижний ценовые сегменты. И AMD, и Intel пользуются на этом рынке примерно той же стратегией, что и на мобильном. Они предлагают адаптированные для данных условий процессоры своих модельных рядов, доля продаж которых применительно к высокопроизводительным вычислительным машинам и системам благодаря относительно невысокой цене и большому количеству программного обеспечения для х86-архитектуры непрерывно увеличивается. Intel предлагает серию процессоров Хеоn двух модификаций. Первая из этих модификаций – Хеоn DP для рабочих станций и двухпроцессорных серверов – представляет собой практически полный аналог Pentium 4 с поддержкой многопроцессорности. Другая модификация – многопроцессорная версия Хеоn МP – оснащается кэш-памятью третьего уровня, объем которой составляет 1 или 2 Мбайт. Эти процессоры чаще всего используются в четырехпроцессорных конфигурациях, они имеют 400-МГц системную шину и оснащены средствами Hyper-Threading. AMD для высокопроизводительных вычислительных машин и систем до недавнего времени предлагала серию процессоров Athlon MP, представляющих собой полный аналог Athlon ХP, но способных работать в двухпроцессорных конфигурациях. Athlon MP смог завоевать немалую популярность благодаря выгодному сочетанию цена/производительность.
Дальнейшее усиление позиций корпораций Intel и AMD связано с внедрением 64-разрядных процессоров. Самые производительные вычислительные системы уже давно строятся на базе 64-разрядных RISC-процессоров, таких, например, как вышеупомянутые процессоры Alpha, Power, UltraSPARC, PA-RICS. Переход на 64 разряда дает то же, что в свое время дал переход от 8 к 16 и затем от 16 к 32 разрядам: значительное увеличение объема прямоадресуемой памяти и повышение скорости и/или точности некоторых вычислений. Intel и AMD при проектировании 64-разрядных процессоров используют почти прямо противоположные подходы. Создаваемая Intel архитектура не является продолжением х86. Хотя возможность использования программного обеспечения для х86 остается, делать это нецелесообразно, так как достигаемый при этом уровень производительности невысок. AMD же, наоборот, предлагает 64-разрядное расширение архитектуры х86, способное эффективно работать как на 32-, так и на 64-разрядных задачах. 64-разрядная архитектура IA-64 разрабатывается Intel с 1994 года при активном участии корпорации Hewlett-Packard. Эта архитектура имеет идеологию VLIW и реализована в ее усовершенствованном варианте EPIC. Архитектура IA-64 впервые была применена Intel в 2001 году в процессоре Itanium с ядром Merced. Это сложный и дорогой процессор, содержащий 325 млн транзисторов: 25 млн в процессорном ядре, включая кэш-память первого и второго уровней объемом 32 и 96 Кбайт соответственно, и по 75 млн в каждой из четырех дополнительных микросхем, составляющих в сумме кэш-память третьего уровня объемом 4 Мбайт. Itanium поддерживает до 4 включенных параллельно процессоров (для их большего количества необходим соответствующий мост). На этом процессоре удалось достичь тактовой частоты 800 МГц и не более. Следующим шагом стал выпуск в 2002 году процессора Itanium 2 на базе ядра McKinley. По сравнению с Merced он быстрее, компактнее и намного лучше по всем основным параметрам. В Itanium 2 кэш-память второго уровня увеличена до 256 Кбайт, кэш-память третьего уровня ( до 3 Мбайт) интегрирована в процессорное ядро.
Предлагаемое AMD 64-разрядное решение х86-64 реализуется в архитектуре Hammer, относящейся к восьмому поколению процессоров х86. Архитектура Hammer достаточно близка к архитектуре процессора Athlon, то есть является ее 64-разрядным расширением. Также имеется девять исполнительных блоков и конвейер длиной 12 стадий (конвейер увеличен на две стадии для увеличения предельных тактовых частот). Длина регистров увеличена до 64 бит, добавлено несколько новых регистров. Введено некоторое количество новых 64-разрядных инструкций. Поддерживается новый и весьма эффективный набор операций с плавающей точкой, использующий 16 новых 128-разрядных регистров. Объем кэш-памяти второго уровня – до 1 Мбайт.
64-разрядный процессор AMD Opteron представлен в 2003 году. Он стартовал с частоты 1400 МГц. Opteron имеет много преимуществ как перед 64-разрядными серверными процессорами Intel, так и перед традиционными 64-разрядными процессорами Alpha, Power PC, UltraSPARC, MIPS. Основной плюс Opteron: при относительно невысоких значениях цены и тепловыделения эти процессоры обладают высокой производительностью. Важным моментом следует признать и то, что разработка корпорации AMD, несмотря на 64-разрядную архитектуру, уже сейчас обеспечена достаточным количеством программного обеспечения. В первую очередь это заслуга архитектуры х86-64, которая благодаря своей обратной совместимости с 32-разрядной системой команд х86 позволяет без потерь и даже с выигрышем в быстродействии исполнять обычный 32-битный программный код.
Основные технические и технологические характеристики процессоров для высокопроизводительных вычислительных машин и систем представлены в табл. 2.2.

Таблица 2.2
Основные технические и технологические характеристики процессоров для высокопроизводительных вычислительных машин и систем

Модель
процессора

Кодовое
наименование процессорного
ядра Тактовая частота
процессора, ГГц
Частота системной шины, MГц Кэш-память L2,
Кбайт Норма тех-
процесса, мкм Типичное
тепловыделение,
Вт

Intel
Xeon DP
Gallatin
Nocona
Irwindale

3,2
3,6
3,6
533
800
800
512
512
2048
0,13
0,09
0,09
70–75
70–75
70–75

Intel
Xeon MP
Gallatin
Potomac
Cranford

3,0
3,33
3,66

400
400
400
512
1024
1024
0,13
0,09
0,09
67–74
67–74
67–74

Intel
Itanium 2
McKinley
Madison
Deerfield
Madison 9M

1,0
1,6
1,6
1,6
400
533
667
800
256
256
256
256
0,18
0,13
0,13
0,09
100
120
120
120
Intel
Pentium D
Prescott

3,2
800
2048
0,09
69

AMD
Opteron
SledgeHammer
Venus/Troy/Athens
Denmark/Italy

2,4
2,6
2,2
800
1000
1000
1024
1024
2048
0,13
0,09
0,09
55–95
55–95
55–95

IBM
Power4+,
Power5
–

1,9
800
2048
0,13
140

Резюме

Центральный процессор (или просто – процессор) является основным вычислительным устройством ВМ, в задачу которого входит исполнение находящейся в памяти машины программы. В состав процессора входят арифметико-логическое устройство, устройство управления и набор устройств локальной памяти процессора (регистры памяти). АЛУ осуществляет функции арифметической и логической обработки информации. УУ выполняет функции управления вычислительным процессом и осуществляет автоматическое исполнение программы. Регистры памяти используются для хранения данных, необходимых для выполнения текущих операций. В состав современных процессоров также входит некоторый набор дополнительных буферных запоминающих устройств, называемых кэш-памятью. Эту память процессор использует для временного (промежуточного) хранения текущей и наиболее часто востребуемой информации.
Главным показателем эффективности работы и технического совершенства процессора является его производительность, которая зависит от параметров самого процессорного ядра, подсистемы памяти, процессорной шины. Разрядность регистров процессора определяет диапазон допустимых значений операндов (длину слова). Одним из основных путей увеличения тактовой частоты работы процессоров является снижение проектных норм технологического процесса, определяющих размеры элементарных электронных компонентов. Увеличение количества операций, выполняемых за один такт работы процессора, достигается путем эффективного использования кэш-памяти и совершенствования архитектурного построения процессора.
Одним из наиболее действенных способов повышения производительности процессоров является внедрение в вычислительный процесс механизма конвейерной обработки команд. Производительность конвейера может существенно снижаться в силу имеющих место в конвейере конфликтных ситуаций, таких как конфликты по ресурсам, по данным и по управлению. Для преодоления конфликтных ситуаций в процессоре используются различные аппаратные и программные схемы и механизмы. Наиболее эффективными способами борьбы с конфликтами по управлению в современных процессорах являются стратегии статического и динамического предсказания условных переходов. Прогрессивным архитектурным решением является суперконвейеризация, которая заключается в увеличении количества ступеней конвейера как за счет добавления новых ступеней, так и путем дробления имеющихся ступеней на несколько более простых подступеней.
Процессоры с расширенной системой команд, реализующих на аппаратурном уровне сложные операторы языков программирования высокого уровня, принято называть процессорами с полным набором команд или процессорами с CISC-архитектурой. Более простая по аппаратной реализации архитектура процессоров с сокращенным набором команд или RISC-архитектура базируется на использовании менее сложных команд и построении в результате этого максимально эффективного конвейера команд.
Еще одним эффективным архитектурным решением, вводящим в вычислительный процесс определенный уровень параллелизма, является применение векторных (потоковых) и матричных схем работы процессоров, которые используются для обработки многокомпонентных операндов типа векторов и массивов. Дополнительный параллелизм вычислений реализуется в суперскалярных процессорах, включающих в свой состав несколько самостоятельных функциональных исполнительных блоков, каждый из которых отвечает за определенный класс выполняемых операций.
В последнее время внедряется новая VLIW-архитектура процессора со сверхдлинными командами, образуемыми более простыми командами типа RISC. При этом благодаря отсутствию сложных аппаратных механизмов, характерных для суперскалярных процессоров, (таких, как предсказание переходов, внеочередное исполнение и т. п.), достигается значительный выигрыш в производительности.
Процессоры ВМ прошли сложный путь эволюции от первого относительно простого 4-разрядного микропроцессора i4004 до современных 32- и 64-разрядных высокопроизводительных процессоров Pentium 4, Xeon, Itanium корпорации Intel и Athlon XP, Athlon 64, Opteron корпорации AMD, а также других менее распространенных моделей. Для рынка недорогих массовых компьютеров корпорациями Intel и AMD предлагаются более дешевые варианты своих базовых процессоров: Celeron, Duron, Sempron. Ведущие производители процессоров (а это, главным образом, Intel и AMD) все более четко позиционируют свои изделия по классам компьютеров, для которых эти процессоры предназначаются. Процессоры для мобильных переносных ПК характеризуются малыми величинами энергопотребления и тепловыделения. Процессорам для высокопроизводительных вычислительных машин и систем присущи более сложные схемные решения. Специфическими особенностями таких процессоров являются повышенные частотные характеристики и увеличенные объемы кэш-памяти, а также переход на 64-разрядную архитектуру.

Контрольные вопросы и задания

1. Какие функции выполняет процессор в вычислительной машине?
2. Что такое процессорные регистры и каково их назначение?
3. От каких параметров зависит производительность процессора?
4. Поясните понятие проектных норм технологического процесса изготовления процессоров. Приведите их характерные значения.
5. Опишите механизм конвейерной обработки команд в процессоре.
6. Охарактеризуйте возможные конфликтные ситуации в конвейере процессора и представьте способы их разрешения.
7. На основе каких механизмов решаются проблемы условных переходов в конвейере команд процессора?
8. Чем отличается статический метод предсказания переходов в конвейере процессора от динамического метода?
9. Дайте понятие суперскалярной архитектуры процессора.
10. Назовите основные отличия архитектур процессоров CISK, RISK и VLIW.
11. Опишите векторные и матричные схемы работы процессоров.
12. Охарактеризуйте первые модели микропроцессоров корпорации Intel (от i8086 до i80386).
13. Поясните функции математического сопроцессора.
14. Чем отличались процессоры семейства i80486 от предыдущих разработок корпорации Intel и других производителей процессоров?
15. Дайте общую характеристику процессоров семейства Intel Pentium.
16. Назовите основные усовершенствования, впервые примененные в процессорах Pentium MMX и Pentium Pro.
17. Какими параметрами отличаются процессоры с торговым наименованием Intel Celeron от исходных («полных») процессоров Intel Pentium?
18. Охарактеризуйте основные нововведения в процессорах Intel Pentium 4 и AMD Athlon.
19. Назовите основные различия в архитектуре и параметрах современных процессоров корпораций Intel и AMD.
20. Каковы особенности разработки процессоров для мобильных ПК?
21. Какие преимущества дает переход к 64-разрядной архитектуре процессоров и какие сложности возникают при ее практическом внедрении?
22. Охарактеризуйте основные типы, параметры и особенности архитектуры процессоров для высокопроизводительных вычислительных машин и систем.
23. Какие типы процессоров наиболее часто используются в настоящее время при разработке новых многопроцессорных вычислительных комплексов.

3. Запоминающие устройства
вычислительных машин
3.1. Назначение, характеристики, типы запоминающих устройств и основные принципы их построения

Запоминающие устройства (ЗУ) обеспечивают фиксацию, хранение и выдачу информации в процессе работы ВМ. Обычно фиксацию информации называют записью, а выдачу информации – чтением (считыванием). Как запись, так и чтение являются процессами обращения к ЗУ.
Каждому типу ЗУ присущи некоторые наиболее важные характеристики, которые определяют его потенциальные возможности и эффективность применения в том или ином конкретном функциональном качестве. К таким характеристикам ЗУ прежде всего относятся:
емкость хранения информации;
2) быстродействие ЗУ при операциях записи-чтения;
3) удельная стоимость хранения единицы информации.
Емкость хранения информации в ЗУ определяется числом битов либо байтов, которое может храниться в данном запоминающем устройстве. Чаще всего значение емкости ЗУ относительно велико, поэтому оно измеряется в производных единицах: Кбайт, Мбайт, Гбайт и т.д.
При оценке быстродействия ЗУ необходимо учитывать применяемый в данном типе ЗУ метод доступа к данным. Различают четыре основных метода доступа: последовательный, прямой, произвольный и ассоциативный.
ЗУ с последовательным методом доступа ориентировано на хранение информации в виде последовательности блоков данных, называемых записями. Для доступа к нужному элементу (слову или байту) необходимо прочитать все предшествующие ему данные. Время доступа зависит от положения требуемой записи в последовательности записей на носителе информации и позиции элемента внутри данной записи. Примером может служить ЗУ на магнитной ленте.
При прямом методе доступа каждая запись имеет уникальный адрес, отражающий ее физическое размещение на носителе информации. Обращение осуществляется как адресный доступ к началу записи с последующим последовательным доступом к определенной единице информации внутри записи. В результате время доступа к определенной позиции является величиной переменной. Такой режим характерен для магнитных дисков.
При произвольном методе доступа каждая ячейка памяти имеет уникальный физический адрес. Обращение к любой ячейке занимает одно и то же время и может производиться в произвольной очередности. Примером могут служить запоминающие устройства основной памяти.
Ассоциативный метод доступа позволяет выполнять поиск ячеек, содержащих такую информацию, в которой значение отдельных битов совпадает с состоянием одноименных битов в заданном образце. Сравнение осуществляется параллельно для всех ячеек памяти, независимо от ее емкости. По ассоциативному принципу построены некоторые устройства кэш-памяти.
Для количественной оценки быстродействия обычно используют три параметра. Первый из них – время доступа. Для памяти с произвольным доступом оно соответствует интервалу времени от момента поступления адреса до момента, когда данные заносятся в память или становятся доступными. В ЗУ с подвижным носителем информации – это время, затрачиваемое на установку головки записи/чтения (или носителя) в нужную позицию. Второй параметр – длительность цикла памяти или период обращения. Это понятие применяется к памяти с произвольным доступом, для которой оно означает минимальное время между двумя последовательными обращениями к памяти. Период обращения включает в себя время доступа плюс некоторое дополнительное время. Дополнительное время может требоваться для затухания сигналов на линиях, а в некоторых типах ЗУ, где считывание информации приводит к ее разрушению, – для восстановления считанной информации. Третий параметр – это скорость передачи, с которой данные могут передаваться в память или из нее.
Удельная стоимость хранения единицы информации принято оценивать отношением общей стоимости ЗУ к его емкости в битах или байтах, то есть стоимостью хранения одного бита или байта информации.
Наиболее распространены три технологических типа запоминающих устройств, отличающихся использованием разных физических принципов записи, хранения и считывания информации. Это ЗУ на электронных микросхемах, ЗУ на магнитных носителях информации (магнитные диски, ленты, карты) и ЗУ на оптических носителях информации (оптические диски разных модификаций).
Важнейшей характеристикой любого типа ЗУ является такое его физическое свойство, как энергозависимость либо энергонезависимость. В энергозависимой памяти информация может быть искажена или потеряна при отключении источника питания. В энергонезависимых ЗУ записанная информация сохраняется и при отключении питающего напряжения. Магнитная и оптическая память – энергонезависимы. Память на электронных микросхемах может быть как энергозависимой, так и нет, в зависимости от ее типа. Помимо энергозависимости следует также учитывать, приводит ли считывание информации к ее разрушению или нет.
Основными типами энергозависимой памяти на электронных микросхемах являются статическая память (Static RAM – SRAM) и динамическая память (Dynamic RAM – DRAM). Исторически сложившееся использование аббревиатура RAM – Random Access Memory («память с произвольным доступом») для именования именно этих типов памяти не совсем корректно, поскольку памятью с произвольным доступом являются также и другие типы памяти, в частности, энергонезависимые типы ЗУ (см. далее).
Запоминающим элементом в статической памяти является электронная схема, обычно состоящая из четырех или шести транзисторов и называемая триггером. Такой триггер имеет два устойчивых состояния, соответствующих значению бита информации (0 или 1). Любое из состояний триггера сохраняется до тех пор, пока подается питание. Схема с четырьмя транзисторами обеспечивает большую емкость всей микросхемы памяти в целом, а следовательно, меньшую стоимость, однако у такой схемы относительно большой ток утечки в режиме хранения информации. Кроме того триггер на четырех транзисторах более чувствителен к воздействию внешних источников излучения, которые могут стать причиной потери информации. Наличие двух дополнительных транзисторов позволяет в определенной мере компенсировать указанные недостатки схемы на четырех транзисторах и, главное, увеличить быстродействие памяти.

<< Пред. стр. 3 (из 12) След. >>

Список литературы по разделу