<< Пред.           стр. 3 (из 12)           След. >>

Список литературы по разделу

 32
 32
 32
 150-200
 233-600
 450 –
  1400
 66
 66-100
 100 –
  133
  8+8
 16+16
 16+16
 
 256
 512
 256/
 512
 0,35
 0,250,180,13
 5,5
 7,5
 10 –
  40
 
  7
  AMD Athlon
 
 Intel
 Pentium 4
  1999
 
 
 2000 32
 
 
 32 500 –
  2200
 
 1300 –
  3400
  200 –
  400
 
 400 –
  800 64+64
 
 
 8+12 K оп.
  256/
 512
 
 256/
 512
  0,180,13
 
 0,180,13
  22 –
  54
 
 42 –
  55
 
 
 
 
  Отметим, что корпорациями Intel и AMD при производстве процессоров Celeron и Duron для компьютеров нижнего ценового диапазона за основу берутся сложные базовые модели процессоров, производительность которых искусственно снижается. Однако такой важный параметр, как тепловыделение, остается практически на прежнем уровне. В результате требуются почти такие же затраты на охлаждение (а соответственно и необходимость установки мощных и шумных охлаждающих вентиляторов), как и высокопроизводительных «старших» моделей процессоров. Фирма VIA реализует свою идеологию создания процессоров для сегмента малопроизводительных недорогих компьютеров, которая заключается в достижении приемлемого (для систем низшего класса) уровня производительности минимальными средствами с отказом от дорогостоящих решений, рассчитанных на принципиально другой, более высокий уровень производительности. При этом архитектура процессора оптимизируется с целью минимизации количества транзисторов и площади кристалла, что позволяет уменьшить как энергопотребление, так и стоимость. В 2003 году был представлен процессор VIA С3, разработанный с учетом указанных принципов минимизации. Процессор VIA С3 с частотой 1ГГц построен на 0,13-мкм ядре Ezra-T, имеет 128 Кбайт кэш-памяти первого уровня и 64 Кбайт – второго. Число транзисторов – 15,8 млн, площадь кристалла – всего 52 мм2, а потребляемая мощность – 12 Вт. Благодаря небольшой площади кристалла процессор имеет вполне конкурентоспособную цену, а при такой малой мощности можно при объемном радиаторе обойтись без охлаждающего вентилятора, снизив тем самым уровень шума и потребляемой энергии.
 В 2004 году основным модельным рядом AMD для настольных компьютеров стало семейство процессоров Athlon 64. Помимо эффективной архитектуры, позволяющей процессорам Athlon 64 показывать высокий уровень быстродействия при сравнительно небольших тактовых частотах, эти процессоры обладают и некоторыми другими достоинствами. Например, в Athlon 64 реализована технология Cool’n’Quiet, позволяющая снижать частоту работы процессора в моменты его неполной загрузки, а соответственно снижать его тепловыделение и энергопотребление. Кроме того, процессор оснащен средствами Enhanced Virus Protection, защищающими ПК от вирусных программ. При использовании 0,13-мкм и 0,09-мкм техпроцессов Athlon 64 имеет частоты 2,2 – 2,4 ГГц. Процессоры Athlon 64 выпускаются на базе трех различных ядер: ClawHammer, NewCastle и Winchester. У ядра ClawHammer, исторически ставшего первым процессорным ядром Athlon 64, объем кэш-памяти второго уровня составляет 1 Мбайт. Ядро NewCastle, спроектированное AMD позднее, обладает вдвое меньшим объемом кэш-памяти второго уровня – 512 Кбайт. Оба ядра изготавливаются по 0,13-мкм технологическому процессу. Более же совершенная технология с 0,09-мкм проектными нормами используется при изготовлении ядра Winchester (кэш-память второго уровня – 512 Кбайт). Заметим, что наличие в процессорах AMD технологии AMD64 никоим образом не уменьшает ни функциональности, ни производительности этих продуктов в привычных 32-битных режимах.
  Процессоры AMD Athlon 64 FX являются еще одной модификацией Athlon 64, которая предназначена для пользователей, стремящихся добиться максимальной производительности своей вычислительной машины. Фактически Athlon 64 FX построен на той же самой микроархитектуре, что и обычный Athlon 64. Однако благодаря ряду новых решений его производительность (а соответственно и цена) выше. В отличие от обычных Athlon 64, коэффициент умножения в нем не зафиксирован, что делает возможным увеличение частоты ядра процессора без увеличения частоты тактового генератора.
  В 2004 году корпорация AMD также предложила новое семейство процессоров для недорогих компьютеров, получившее название Sempron. Эти процессоры фактически представляют собой переименованные процессоры Athlon XP. Модельный ряд процессоров Sempron с рейтингами до 2800+ составляют процессоры с частотой шины 333 МГц, частотами ядра до 2 ГГц и объемом кэш-памяти второго уровня объемом 256 Кбайт. Sempron 3000+ – это процессор на ядре Barton с частотой 2 ГГц, 333-МГц шиной и кэш-памятью второго уровня объемом 512 Кбайт.
  В 2004 году продолжилось и развитие процессоров семейства Pentium 4. С переходом на 0,09-мкм технологический процесс корпорация Intel разработала новое процессорное ядро, получившее название Prescott, которое, как и его предшественники Willamette и Northwood, основано на архитектуре NetBurst. Ос­новная идея этой архитектуры – достижение высо­кой производительности благодаря функционированию процессора на высокой тактовой частоте. В Prescott по сравнению с предшествующими ядрами архитектура NetBurst несколько усовершенствована. Так, в Prescott удлинен исполнительный конвейер до 31 ступени. При этом частоты Pentium 4 на ядре Prescott к 2005 году достигли 3,8 ГГц (для сравнения укажем, что в процессоре Pentium III с 0,13-мкм ядром Taulatin и конвейером с 10 ста­диями максимальная частота превысила 1,5 ГГц, а в процессоре Pentium 4 с 0,13-мкм ядром Northwood и конвейером с 20 ста­диями максимальная частота достигла 3 ГГц и выше). Для того чтобы производительность процессоров на новом ядре Prescott на одинаковых частотах с Northwood не снизилась, в процессорах на ядрах Prescott увеличена кэш-память второго уровня с 512 Кбайт до 1 Мбайт, а кэш-память первого уровня для данных – с 8 Кбайт до 16 Кбайт. Размер же кэш-памяти для инструкций остался неизменным: он способен вместить 12 000 микроинструкций (микроопераций или микрокоманд), что примерно эквивалентно объему в 8 –16 Кбайт.
  В ядре Prescott усовершенствовано предсказание ветвлений – основ­ной метод борьбы с простоями процессора, вызванны­ми необходимостью очистки и повторного заполнения длинного конвейера после неправильно предсказанных переходов. Работа блока предсказания переходов, применяюще­гося в процессорах с NetBurst-архитектурой, основы­вается на использовании буфера, в котором накапливается статистика выпол­ненных переходов. То есть, для предсказания переходов используется вероятностная модель – пре­имущественным направлением перехода процессор счи­тает то направление, которое наиболее вероятно соглас­но накопленным статистическим данным. Этот алго­ритм очень неплохо проявил себя на практике, однако он совершенно бесполезен в случае отсутствия стати­стики по конкретному переходу. Процессоры на ядре Northwood в этом случае всегда выбирали направление перехода «назад», вполне обоснованно считая, что са­мые распространенные условные переходы – это ус­ловия продолжения циклов. В Prescott эта статическая схема предсказания переходов была существенно дора­ботана. Теперь, если по встретившемуся переходу ста­тистика отсутствует, модуль предсказания перехода не делает однозначного вывода о его направлении, а осно­вывает свое решение на анализе расстояния, на кото­рое совершается переход, поскольку обратные перехо­ды в циклах редко совершаются за некую эмпирически найденную границу. Кроме того, была усовершенство­вана и схема динамического предсказания переходов. В результате, если у процессоров на ядре Northwood число неправильно предсказанных переходов в среднем составляло 0,86 на 100 инструкций, то теперь эта величина – 0,75 неправильных переходов на 100 инструкций. Иными словами, количество неправильно предсказанных пере­ходов снизилось на 12%.
  Второе улучшение, реализованное в Prescott, – ус­коренное исполнение некоторых команд. Несмотря на то, что количество целочисленных АЛУ в процессоре осталось прежним – два для простых инструкций, ра­ботающих на удвоенной частоте ядра, и одно для слож­ных инструкций, – скорость исполнения отдельных ко­манд в Prescott возросла. Связано это с некоторыми изменениями в архитектуре АЛУ. Так, в одно из двух «быстрых» АЛУ был добавлен блок обычного циклического сдвига. Теперь та­кие инструкции исполняются быстрее, поскольку в пре­дыдущих реализациях Pentium 4 сдвиги трактовались как сложные инструкции и выполнялись на «медлен­ном» АЛУ. Также гораздо быстрее в процессорах на яд­ре Prescott выполняются операции целочислен­ного умножения. В предыдущих реализациях NetBurst целочисленное умножение выполнялось блоком FPU с предварительным переводом операндов сначала в фор­мат с плавающей точкой, а потом обратно. В Prescott же операции целочисленного умножения стали выпол­няться целочисленным АЛУ, что ощути­мо снизило время их выполнения. Так, скорость выполнения сдвигов возросла по меньшей мере в четыре раза, а целочисленные умноже­ния стали выполняться примерно на 25% быстрее.
  Третье усовершенствование NetBurst в Prescott – оптимизация алгоритма предварительной выборки дан­ных. Она призвана уменьшить отрицательный эффект от ситуаций, когда в кэш-памяти процессора отсутствуют дан­ные для обработки. Усовершенствования затрагивают как программную предвыборку, инициируемую рабо­тающей программой, так и аппаратную предвыборку.
  Еще одно новшество ядра Prescott – это модернизация технологии Hyper-Threading за счет увеличения количества эксклюзивных ресур­сов процессора для каждого потока, внедрения двух новых специаль­ных инструкций для управления несколькими потока­ми и возможности в Prescott распараллеливать некоторые процессы, которые в Northwood могли выполняться только по одному (в ча­стности, это касается одновременной работы потоков с кэш-памятью). В ядре Prescott дора­ботан набор SIMD-инструкций, получивший наименование SSE3 и содержащий 13 новых инструкций. Расширилась и функциональность процессоров Pentium 4. Процессоры Pentium 4 на ядре Prescott совместимы с технологией EM64T (Intel Extended Memory 64 Technology), практически полностью идентичной 64-битным расширениям AMD64. Intel реализовала технологию Execute Disable Bit, аналогичную Enhanced Virus Protection корпорации AMD, и начинает снабжать свои процессоры семейства Pentium 4 средствами Intel Enhanced SpeedStep, подобными Cool’n’Quiet от AMD.
  Кроме обычных процессоров Pentium 4, среди предложений Intel есть и процессор Pentium 4 Extreme Edition, позиционирование которого сходно с позиционированием Athlon 64 FX корпорации AMD: этот процессор ориентирован на самых требовательных пользователей. Pentium 4 Extreme Edition с частотой 3,46 ГГц выполнен на ядре Gallatin с 0,13-мкм техпроцессом, построенном, в свою очередь, на базе ядра Northwood. Основное отличие Pentium 4 Extreme Edition от обычных процессоров Pentium 4 на ядре Northwood – наличие кэш-памяти третьего уровня объемом 2 Мбайт и использование 1066-МГц системной шины.
  К 2005 году на смену традиционным массовым процессорам Celeron пришли процессоры семейства Celeron D с ядром Prescott. Благодаря новому ядру процессоры Celeron D приобрели увеличенную до 256 Кбайт кэш-память второго уровня, 533-МГц системную шину и совместимость с набором инструкций SSE3. Эти изменения заметно повысили производительность процессоров Celeron D по сравнению с предыдущим семейством Celeron, благодаря чему они стали достаточно удачным выбором с точки зрения соотношения цена/производительность.
  Хотя доминирующее положение на рынке ПК занимают процессоры с архитектурой «x86», следует отметить разработку достаточно прогрессивного процессора для менее распространенного семейства компьютеров Macintosh фирмы Apple. Такой разработкой стал 64-разрядный RISC-процессор IBM PowerPC 970, именуемый фирмой Apple как PowerPC G5. Процессор PowerPC G5 – это дальнейшее развитие довольно успешного предшественника – Power4. Одна­ко если Power4 предназначался для серверов и высо­копроизводительных рабочих станций, то PowerPC G5 ориентирован на настольные ПК. В новом процессоре отсутствует кэш-память третьего уровня. При разработке этого процессора существенное внимание было уделено скорости работы с потоковыми данными, вследствие чего значительно изменилась системная шина этого процессора. PowerPC G5 изготавливается на производственных мощностях IBM с применением техпроцесса 0,13-мкм. Кон­вейер PowerPC G5, как и конвейеры процессоров AMD, относительно невелик и состоит из десяти ступеней.
  Корпорация IBM решила не отказываться от полной об­ратной совместимости со старыми 32-разрядными при­ложениями. Это позволяет использовать на компьюте­рах серии Apple PowerMac G5 как старые 32-разрядные, так и новые 64-разрядные операционные системы MacOS и приложения. Увеличение же разрядности регистров процессора повлекло за собой рост доступного для про­цессора адресного пространства до 4 Тбайт. В рассматриваемом про­цессоре объем кэш-памяти второго уровня составляет 512 Кбайт, кэш-память первого уровня имеет 64 Кбайт для инструкций и 32 Кбайт для дан­ных. При этом по пропускной способности и латентности кэш-память PowerPC G5 не уступают кэш-памяти Pentium 4.
 К настоящему времени ведущими разработчиками и изготовителями современных процессоров для класса персональных компьютеров клона IBM PC являются корпорации Intel (примерно 82% рынка) и AMD (около 17% рынка). Очень незначительная часть (менее 1%) приходится на долю фирм VIA (C3) и Transmeta (Crusoe). От проникновения других архитектур этот рынок надежно защищен гигантским объемом программного обеспечения, ориентированного на архитектуру x86. Однако можно утверждать, что причины столь внушительного превосходства Intel носят главным образом не технологический, а исторический и маркетинговый характер.
  Ведущие производители процессоров в последнее время четко позиционируют свои изделия по классам компьютеров, для которых эти процессоры предназначаются. Поэтому далее отдельно рассмотрим характеристики процессоров для портативных мобильных компьютеров и процессоров для высокопроизводительных вычислительных машин и систем.
 2.4. Процессоры для портативных мобильных компьютеров
 
  Портативные мобильные компьютеры («ноутбуки») становятся все более по­пулярным классом ПК. К 2005 году доля ноутбуков в общих продажах компьютеров состав­ила около 30%, и эта доля имеет явную тенденцию к интенсивному росту. Популярность ноутбуков связана с постоянным снижением цен на компьютеры такого класса и все более широким распространение бес­проводных сетей, что делает использование портативных мобильных компьютеров более удобным по сравнению с настольными машинами. Поэтому в модельных ря­дах ведущих изготовителей процессоров все более заметное место занимают процессоры для ноутбуков.
  Создание процессоров для мобильных ПК имеет свою специфику. Помимо высокой производительности, такие процессоры должны быть экономичными с точки зрения энергопотребления, так как для ноутбука размеры, масса и время автономной работы – чрезвычайно важ­ные параметры, часто не менее важные, чем производи­тельность. На эти характеристики архитектура применяе­мого центрального процессора влияет весьма значитель­но.
  Процессоры для мобильных ПК, характеризующиеся меньшим тепловы­делением и энергопотреблением, обладают большей сте­пенью мобильности, поскольку низкое энергопотребление позволяет либо увеличить время работы компьютера от стандартной батареи, либо уменьшить ее массу и раз­меры при сохранении приемлемого времени автономной работы, а низкое тепловыделение дает возможность ог­раничиться легкой и компактной системой охлаждения. Поэтому процессоры для портативных мобильных компьютеров должны в той или иной степени отличаться от процессоров, устанавливаемых в настольные ПК.
 Следует заметить, что, помимо создания специальных «мобильных» архитектур процессоров, возможен и другой подход, позволяющий предложить конкурентноспособные решения процессоров для ноутбуков. Такие процессоры можно получить, понижая энергопотребление обычных массовых процессоров для настольных ПК. Снижение энергопотребления процессора до уровня, приемлемого для ноутбуков, достигается уменьшением тактовой частоты и напряжения питания процессора. Известно, что энергопотребление процессора линейно зависит от частоты и квадратично от напряжения питания процессора. Оперируя этими двумя характеристиками, можно добиться относительно высокой экономичности. Однако лучшим сочетанием характеристик, естественно, будут обладать все же процессоры, целенаправленно разработанные для использования в мобильных компьютерах, а не адаптированные варианты «настольных» процессоров.
 Ситуация на рынке процессоров для портативных мобильных компьютеров до некоторых пор во многом определялась положением дел на рынке центральных процессоров для настольных ПК.
  Корпорациями AMD и Intel для мобильных компьютеров предлагались те же самые процессоры с добавлением в них лишь технологии энергосбережения. При этом использование мобильного аналога высокопроизводительного процессора Pentium 4 – его модификации Pentium 4-М – с длинным конвейером и чрезвычайно высокими тактовыми частотами приводит к достаточно большому потреблению энергии, а поэтому возможно лишь в относительно тяжелых и громоздких переносных компьютерах. Именно поэтому Intel предложила новый мобильный процессор Pentium М со специализированной архитектурой. Базой для разработки Pentium М была выбрана архитектура предыдущего поколения процессоров Pentium III, однако для увеличения тактовой частоты конвейер в Pentium М удлинен по сравнению с конвейером Pentium III, кэш-память первого уровня расширена до 64 Кбайт, второго уровня – до 1 – 2 Мбайт. Кроме того, добавлена реализация набора инструкций SSE2. Pentium М обладает усовершенствованным блоком предсказания переходов и поддерживает специальные технологии, призванные обеспечивать более рациональное использование ресурсов с точки зрения уменьшения энергопотребления. Pentium М имеет относительно невысокое тепловыделение, поскольку многие его блоки при отсутствии обращений к ним просто отключаются или переходят в состояние ожидания.
  Процессоры семейства Pentium M на ядре Banias с 0,13-мкм техпроцессом рассчитаны на тактовые частоты от 1,3 до 1,7 ГГц и 400-МГц системную шину, их энергопотребление не превышает 24 Вт. Pentium M на ядре Dothan с 0,09-мкм техпроцессом имеют вдвое большую кэш-память второго уровня (2 Мбайт), тактовые частоты от 1,5 до 2 ГГц, 400-МГц системную шину и энергопотребление не более 21 Вт. Все процессоры семейства Pentium M оснащены средствами Enhanced Intel SpeedStep. Благодаря этой технологии программное обеспечение ноутбука получает контроль над множителем тактовой частоты ЦП, что используется для ее понижения в моменты неполной загрузки процессора вплоть до 600 МГц. При этом время работы ноутбука от батарей заметно повышается, поскольку энергопотребление Pentium M в экономичном режиме снижается до 6–8 Вт.
  Корпорация AMD противопоставила модельному ряду Pentium M корпорации Intel свои процессоры семейства Mobile Athlon 64 и Turion 64. Эти процессоры имеют архитектуру, полностью аналогичную архитектуре «настольных» моделей Athlon 64. Процессоры Turion 64 совместимы с 64-битными расширениями AMD64. Модельный ряд Turion 64 представлен, во-первых, процессорами с кэш-памятью второго уровня объемом 1 Мбайт, которые имеют частоты от 1,6 до 2,2 ГГц и энергопотребление до 60 Вт, во-вторых, процессорами с вдвое меньшей кэш-памятью второго уровня (512 Кбайт), которые имеют частоты от 1,6 до 2,0 ГГц и энергопотребление до 35 Вт. Для снижения энергопотребления в этих процессорах применена фирменная технология PowerNow!, по сути аналогичная технологиям Cool’n’Quiet и Intel Enhanced SpeedStep. Программное обеспечение ноутбука также имеет возможность управления коэффициентом умножения частоты процессора, благодаря чему частота может быть снижена до 800 МГц, а энергопотребление процессора при этом составляет около 12 Вт.
  Для суперпортативных мобильных компьютеров (субноутбуков и мининоутбуков) Intel предлагает специальные классы процессоров: Low Voltage Pentium M и Ultra Low Voltage Pentium M. Эти процессоры благодаря пониженному напряжению питания и уменьшенной тактовой частоте имеют гораздо более низкие энергопотребление и тепловыделение. Так, у процессоров Low Voltage Pentium M на ядре Dothan тактовая частота 1,4 – 1,5 ГГц и максимальное энергопотребление 10 Вт. Класс процессоров Ultra Low Voltage Pentium M еще более экономичен: такие процессоры на ядре Dothan имеют тактовые частоты 1,0 – 1,2 ГГц и энергопотребление, не превышающее 5 Вт. Напряжение питания этих процессоров составляет всего 0,96–1,05 В.
  Для рынка недорогих ноутбуков корпорация Intel предлагает семейство процессоров Celeron M, представляющих собой упрощенные версии процессоров Pentium M. Celeron M с ядром Dothan работает на частотах от 1,3 до 1,5 ГГц, имеет кэш-память второго уровня объемом 1 Мбайт, частоту системной шины – 400 МГц, энергопотребление – до 21 Вт. У Celeron M отсутствует технология Enhanced Intel SpeedStep, поэтому Celeron M менее экономичен, чем Pentium M. Помимо обычных Celeron M корпорацией Intel разработано семейство процессоров Ultra Low Voltage Celeron M, предназначенных для ультракомпактных ноутбуков. Эти процессоры имеют частоты 0,9 и 1,0 ГГц. Пониженные частоты и невысокое напряжение питания позволяют этим процессорам иметь энергопотребление всего 5 Вт.
  Семейство процессоров AMD Mobile Sempron представляет собой упрощенные и удешевленные версии процессоров Mobile Athlon 64 и Turion 64. Такие процессоры на ядре Sonora укладываются в рамки энергопотребления до 25 Вт, имеют тактовые частоты 1,6 и 1,8 ГГц, кэш-память второго уровня объемом 128 – 256 Кбайт, работают с 800-МГц системной шиной HyperTransport. Процессоры Mobile Sempron оснащены фирменными средствами энергосбережения – технологией PowerNow!, позволяющей понижать тактовую частоту в моменты неполной загрузки.
 
 
 2.5. Процессоры для высокопроизводительных
  вычислительных машин и систем
 
  В сфере разработки и применения процессоров для высокопроизводительных вычислительных машин и систем в последние годы произошли значительные стратегические изменения. До середины 1980-х годов высокопроизводительные вычислительные машины и системы (МВК, суперкомпьютеры) создавались как единичные экземпляры специализированного назначения, для которых проектировались уникальные архитектуры дорогостоящих многокомпонентных векторно-конвейерных процессоров, собираемых из большого коли­чества микросхем. К настоящему времени высокопроизводительные вычислительные машины и системы переходят в разряд серийно выпускаемых и относительно широко востребуемых изделий. Поэтому разработчикам таких систем экономически целесообразнее использовать в своей продукции серийно выпускаемые микроэлектронные компоненты, тем более что прогресс в их характеристиках и производстве превратил микропроцессоры, микросхемы памяти и адаптеры вне­шних устройств со стандартными интерфейсами в доступные и эффективные устройства. В свою очередь применение серийных компонентов позволило относительно легко масштабировать МВК до значительного числа процессоров (см. раздел 13). Ориентация на массовый рынок изделий микроэлектроники, выпуск которых достаточно хорошо освоен промышленностью, также дает возможность значительно сократить сроки и стоимость производства МВК, сконцентрировав при этом основные усилия на совершенствовании и разработке новых архитектурных решений вычислительных комплексов в целом.
 На рынке процессоров для высокопроизводительных вычислительных машин и систем (особенно в сегменте самых мощных из них) до последнего времени преобладали традиционные для этой сферы применения процессоры, такие как Alpha корпорации DEC, UltraSPARC корпорации Sun Microsystems, PA-RISC корпорации Hewlett-Packard, Power корпорации IBM, MIPS корпорации SGL. Однако лидирующие позиции на нем начинают занимать производители х86-процессоров, которым удалось практически полностью занять средний и нижний ценовые сегменты. И AMD, и Intel пользуются на этом рынке примерно той же стратегией, что и на мобильном. Они предлагают адаптированные для данных условий процессоры своих модельных рядов, доля продаж которых применительно к высокопроизводительным вычислительным машинам и системам благодаря относительно невысокой цене и большому количеству программного обеспечения для х86-архитектуры непрерывно увеличивается. Intel предлагает серию процессоров Хеоn двух модификаций. Первая из этих модификаций – Хеоn DP для рабочих станций и двухпроцессорных серверов – представляет собой практически полный аналог Pentium 4 с поддержкой многопроцессорности. Другая модификация – многопроцессорная версия Хеоn МP – оснащается кэш-памятью третьего уровня, объем которой составляет 1 или 2 Мбайт. Эти процессоры чаще всего используются в четырехпроцессорных конфигурациях, они имеют 400-МГц системную шину и оснащены средствами Hyper-Threading. AMD для высокопроизводительных вычислительных машин и систем до недавнего времени предлагала серию процессоров Athlon MP, представляющих собой полный аналог Athlon ХP, но способных работать в двухпроцессорных конфигурациях. Athlon MP смог завоевать немалую популярность благодаря выгодному сочетанию цена/производительность.
 Дальнейшее усиление позиций корпораций Intel и AMD связано с внедрением 64-разрядных процессоров. Самые производительные вычислительные системы уже давно строятся на базе 64-разрядных RISC-процессоров, таких, например, как вышеупомянутые процессоры Alpha, Power, UltraSPARC, PA-RICS. Переход на 64 разряда дает то же, что в свое время дал переход от 8 к 16 и затем от 16 к 32 разрядам: значительное увеличение объема прямоадресуемой памяти и повышение скорости и/или точности некоторых вычислений. Intel и AMD при проектировании 64-разрядных процессоров используют почти прямо противоположные подходы. Создаваемая Intel архитектура не является продолжением х86. Хотя возможность использования программного обеспечения для х86 остается, делать это нецелесообразно, так как достигаемый при этом уровень производительности невысок. AMD же, наоборот, предлагает 64-разрядное расширение архитектуры х86, способное эффективно работать как на 32-, так и на 64-разрядных задачах. 64-разрядная архитектура IA-64 разрабатывается Intel с 1994 года при активном участии корпорации Hewlett-Packard. Эта архитектура имеет идеологию VLIW и реализована в ее усовершенствованном варианте EPIC. Архитектура IA-64 впервые была применена Intel в 2001 году в процессоре Itanium с ядром Merced. Это сложный и дорогой процессор, содержащий 325 млн транзисторов: 25 млн в процессорном ядре, включая кэш-память первого и второго уровней объемом 32 и 96 Кбайт соответственно, и по 75 млн в каждой из четырех дополнительных микросхем, составляющих в сумме кэш-память третьего уровня объемом 4 Мбайт. Itanium поддерживает до 4 включенных параллельно процессоров (для их большего количества необходим соответствующий мост). На этом процессоре удалось достичь тактовой частоты 800 МГц и не более. Следующим шагом стал выпуск в 2002 году процессора Itanium 2 на базе ядра McKinley. По сравнению с Merced он быстрее, компактнее и намного лучше по всем основным параметрам. В Itanium 2 кэш-память второго уровня увеличена до 256 Кбайт, кэш-память третьего уровня ( до 3 Мбайт) интегрирована в процессорное ядро.
  Предлагаемое AMD 64-разрядное решение х86-64 реализуется в архитектуре Hammer, относящейся к восьмому поколению процессоров х86. Архитектура Hammer достаточно близка к архитектуре процессора Athlon, то есть является ее 64-разрядным расширением. Также имеется девять исполнительных блоков и конвейер длиной 12 стадий (конвейер увеличен на две стадии для увеличения предельных тактовых частот). Длина регистров увеличена до 64 бит, добавлено несколько новых регистров. Введено некоторое количество новых 64-разрядных инструкций. Поддерживается новый и весьма эффективный набор операций с плавающей точкой, использующий 16 новых 128-разрядных регистров. Объем кэш-памяти второго уровня – до 1 Мбайт.
  64-разрядный процессор AMD Opteron представлен в 2003 году. Он стартовал с частоты 1400 МГц. Opteron имеет много преимуществ как перед 64-разрядными серверными процессорами Intel, так и перед традиционными 64-разрядными процессорами Alpha, Power PC, UltraSPARC, MIPS. Основной плюс Opteron: при относительно невысоких значениях цены и тепловыделения эти процессоры обладают высокой производительностью. Важным моментом следует признать и то, что разработка корпорации AMD, несмотря на 64-разрядную архитектуру, уже сейчас обеспечена достаточным количеством программного обеспечения. В первую очередь это заслуга архитектуры х86-64, которая благодаря своей обратной совместимости с 32-разрядной системой команд х86 позволяет без потерь и даже с выигрышем в быстродействии исполнять обычный 32-битный программный код.
 Основные технические и технологические характеристики процессоров для высокопроизводительных вычислительных машин и систем представлены в табл. 2.2.
 
  Таблица 2.2
 Основные технические и технологические характеристики процессоров для высокопроизводительных вычислительных машин и систем
 
 
 Модель
 процессора
 
 Кодовое
 наименование процессорного
 ядра Тактовая частота
  процессора, ГГц
  Частота системной шины, MГц Кэш-память L2,
  Кбайт Норма тех-
  процесса, мкм Типичное
 тепловыделение,
  Вт
 
 Intel
 Xeon DP
  Gallatin
  Nocona
  Irwindale
 
  3,2
  3,6
  3,6
  533
  800
  800
  512
  512
  2048
  0,13
  0,09
  0,09
 70–75
 70–75
 70–75
 
 
 Intel
 Xeon MP
  Gallatin
  Potomac
  Cranford
 
  3,0
  3,33
  3,66
 
  400
  400
  400
  512
  1024
  1024
  0,13
  0,09
  0,09
 67–74
 67–74
 67–74
 
 
 Intel
 Itanium 2
  McKinley
  Madison
  Deerfield
  Madison 9M
 
  1,0
  1,6
  1,6
  1,6
  400
  533
  667
  800
  256
  256
  256
  256
  0,18
  0,13
  0,13
  0,09
  100
  120
  120
  120
 Intel
 Pentium D
  Prescott
 
  3,2
  800
  2048
  0,09
  69
 
 AMD
 Opteron
  SledgeHammer
  Venus/Troy/Athens
  Denmark/Italy
 
  2,4
  2,6
  2,2
  800
  1000
  1000
  1024
  1024
  2048
  0,13
  0,09
  0,09
 55–95
 55–95
 55–95
 
 IBM
 Power4+,
 Power5
  –
 
 
  1,9
  800
  2048
  0,13
  140
 
 
 Резюме
 
 Центральный процессор (или просто – процессор) является основным вычислительным устройством ВМ, в задачу которого входит исполнение находящейся в памяти машины программы. В состав процессора входят арифметико-логическое устройство, устройство управления и набор устройств локальной памяти процессора (регистры памяти). АЛУ осуществляет функции арифметической и логической обработки информации. УУ выполняет функции управления вычислительным процессом и осуществляет автоматическое исполнение программы. Регистры памяти используются для хранения данных, необходимых для выполнения текущих операций. В состав современных процессоров также входит некоторый набор дополнительных буферных запоминающих устройств, называемых кэш-памятью. Эту память процессор использует для временного (промежуточного) хранения текущей и наиболее часто востребуемой информации.
  Главным показателем эффективности работы и технического совершенства процессора является его производительность, которая зависит от параметров самого процессорного ядра, подсистемы памяти, процессорной шины. Разрядность регистров процессора определяет диапазон допустимых значений операндов (длину слова). Одним из основных путей увеличения тактовой частоты работы процессоров является снижение проектных норм технологического процесса, определяющих размеры элементарных электронных компонентов. Увеличение количества операций, выполняемых за один такт работы процессора, достигается путем эффективного использования кэш-памяти и совершенствования архитектурного построения процессора.
  Одним из наиболее действенных способов повышения производительности процессоров является внедрение в вычислительный процесс механизма конвейерной обработки команд. Производи­тельность конвейера может существенно снижаться в силу имеющих место в конвейере конф­ликтных ситуаций, таких как конф­ликты по ресурсам, по данным и по управлению. Для преодоления конф­ликтных ситуаций в процессоре используются различные аппаратные и программные схемы и механизмы. Наибо­лее эффективными способами борьбы с конфликтами по управлению в современных процессорах являются стратегии статического и динамического предсказания условных переходов. Прогрессивным архитектурным решением является суперконвейеризация, которая заключается в увеличении количества сту­пеней конвейера как за счет добавления новых ступеней, так и путем дробле­ния имеющихся ступеней на несколько более простых подступеней.
  Процессоры с расширенной системой команд, реализующих на аппаратурном уров­не сложные операторы языков программирования высокого уровня, принято называть процессорами с полным набором команд или процессорами с CISC-архитектурой. Более простая по аппаратной реализации архи­тектура процессоров с сокращенным набором команд или RISC-архитектура базируется на использовании менее сложных команд и построении в результате этого максимально эф­фективного конвейера команд.
  Еще одним эффективным архитектурным решением, вводящим в вычислительный процесс определенный уровень параллелизма, является применение векторных (потоковых) и матричных схем работы процессоров, которые используются для обработки многокомпонентных операндов типа векторов и массивов. Дополнительный параллелизм вычислений реализуется в суперскалярных процессорах, включающих в свой состав не­сколько самостоятельных функциональных исполнительных блоков, каждый из которых отвечает за определенный класс выполняемых операций.
  В последнее время внедряется новая VLIW-архитектура процессора со сверхдлинными командами, образуемыми более простыми командами типа RISC. При этом благодаря отсутствию сложных аппаратных механизмов, характерных для суперскалярных процессоров, (таких, как предсказание переходов, внеоче­редное исполнение и т. п.), достигается значительный выигрыш в производительности.
  Процессоры ВМ прошли сложный путь эволюции от первого относительно простого 4-разрядного микропроцессора i4004 до современных 32- и 64-разрядных высокопроизводительных процессоров Pentium 4, Xeon, Itanium корпорации Intel и Athlon XP, Athlon 64, Opteron корпорации AMD, а также других менее распространенных моделей. Для рынка недорогих массовых компьютеров корпорациями Intel и AMD предлагаются более дешевые варианты своих базовых процессоров: Celeron, Duron, Sempron. Ведущие производители процессоров (а это, главным образом, Intel и AMD) все более четко позиционируют свои изделия по классам компьютеров, для которых эти процессоры предназначаются. Процессоры для мобильных переносных ПК характеризуются малыми величинами энергопотребления и тепловы­деления. Процессорам для высокопроизводительных вычислительных машин и систем присущи более сложные схемные решения. Специфическими особенностями таких процессоров являются повышенные частотные характеристики и увеличенные объемы кэш-памяти, а также переход на 64-разрядную архитектуру.
 
 Контрольные вопросы и задания
 
 1. Какие функции выполняет процессор в вычислительной машине?
 2. Что такое процессорные регистры и каково их назначение?
 3. От каких параметров зависит производительность процессора?
 4. Поясните понятие проектных норм технологического процесса изготовления процессоров. Приведите их характерные значения.
 5. Опишите механизм конвейерной обработки команд в процессоре.
 6. Охарактеризуйте возможные конфликтные ситуации в конвейере процессора и представьте способы их разрешения.
 7. На основе каких механизмов решаются проблемы условных переходов в конвейере команд процессора?
 8. Чем отличается статический метод предсказания переходов в конвейере процессора от динамического метода?
 9. Дайте понятие суперскалярной архитектуры процессора.
 10. Назовите основные отличия архитектур процессоров CISK, RISK и VLIW.
 11. Опишите векторные и матричные схемы работы процессоров.
 12. Охарактеризуйте первые модели микропроцессоров корпорации Intel (от i8086 до i80386).
 13. Поясните функции математического сопроцессора.
 14. Чем отличались процессоры семейства i80486 от предыдущих разработок корпорации Intel и других производителей процессоров?
 15. Дайте общую характеристику процессоров семейства Intel Pentium.
 16. Назовите основные усовершенствования, впервые примененные в процессорах Pentium MMX и Pentium Pro.
 17. Какими параметрами отличаются процессоры с торговым наименованием Intel Celeron от исходных («полных») процессоров Intel Pentium?
 18. Охарактеризуйте основные нововведения в процессорах Intel Pentium 4 и AMD Athlon.
 19. Назовите основные различия в архитектуре и параметрах современных процессоров корпораций Intel и AMD.
 20. Каковы особенности разработки процессоров для мобильных ПК?
 21. Какие преимущества дает переход к 64-разрядной архитектуре процессоров и какие сложности возникают при ее практическом внедрении?
 22. Охарактеризуйте основные типы, параметры и особенности архитектуры процессоров для высокопроизводительных вычислительных машин и систем.
 23. Какие типы процессоров наиболее часто используются в настоящее время при разработке новых многопроцессорных вычислительных комплексов.
 
 3. Запоминающие устройства
  вычислительных машин
  3.1. Назначение, характеристики, типы запоминающих устройств и основные принципы их построения
 
  Запоминающие устройства (ЗУ) обеспечивают фиксацию, хранение и выдачу информации в процессе работы ВМ. Обычно фиксацию информации называют записью, а выдачу информации – чтением (считыванием). Как запись, так и чтение являются процессами обращения к ЗУ.
  Каждому типу ЗУ присущи некоторые наиболее важные характеристики, которые определяют его потенциальные возможности и эффективность применения в том или ином конкретном функциональном качестве. К таким характеристикам ЗУ прежде всего относятся:
 емкость хранения информации;
 2) быстродействие ЗУ при операциях записи-чтения;
  3) удельная стоимость хранения единицы информации.
  Емкость хранения информации в ЗУ определяется числом битов либо байтов, которое может хранить­ся в данном запоминающем устройстве. Чаще всего значение емкости ЗУ относительно велико, поэтому оно измеряется в производных единицах: Кбайт, Мбайт, Гбайт и т.д.
  При оценке быстродействия ЗУ необходимо учитывать применяемый в данном типе ЗУ метод доступа к данным. Различают четыре основных метода доступа: последовательный, прямой, произвольный и ассоциативный.
  ЗУ с последовательным методом доступа ориентировано на хранение информации в виде последовательности блоков данных, называе­мых записями. Для доступа к нужному элементу (слову или байту) необходи­мо прочитать все предшествующие ему данные. Время доступа зависит от положения требуемой записи в последовательности записей на носителе ин­формации и позиции элемента внутри данной записи. Примером может слу­жить ЗУ на магнитной ленте.
  При прямом методе доступа каждая запись имеет уникальный адрес, отражающий ее фи­зическое размещение на носителе информации. Обращение осуществляется как адресный доступ к началу записи с последующим последовательным досту­пом к определенной единице информации внутри записи. В результате время доступа к определенной позиции является величиной переменной. Такой ре­жим характерен для магнитных дисков.
  При произвольном методе доступа каждая ячейка памяти имеет уникальный физический адрес. Обращение к любой ячейке занимает одно и то же время и может произ­водиться в произвольной очередности. Примером могут служить запоминаю­щие устройства основной памяти.
  Ассоциативный метод доступа позволяет выполнять поиск ячеек, содержащих такую информацию, в которой значение отдельных битов совпа­дает с состоянием одноименных битов в заданном образце. Сравнение осуще­ствляется параллельно для всех ячеек памяти, независимо от ее емкости. По ассоциативному принципу построены некоторые устройства кэш-памяти.
  Для коли­чественной оценки быстродействия обычно используют три параметра. Первый из них – время доступа. Для памяти с произвольным доступом оно соответствует интервалу времени от момента поступления адреса до момента, когда данные заносятся в память или становятся доступными. В ЗУ с подвижным носителем информации – это время, затрачиваемое на установку головки записи/чтения (или носителя) в нужную позицию. Второй параметр – длительность цикла памяти или период обращения. Это понятие применяет­ся к памяти с произвольным доступом, для которой оно означает минимальное время между двумя последовательными обращениями к памяти. Период обра­щения включает в себя время доступа плюс некоторое дополнительное время. Дополнительное время может требоваться для затухания сигналов на линиях, а в некоторых типах ЗУ, где считывание информации приводит к ее разруше­нию, – для восстановления считанной информации. Третий параметр – это скорость передачи, с которой данные могут передаваться в па­мять или из нее.
  Удельная стоимость хранения единицы информации принято оценивать отношением общей стоимости ЗУ к его ем­кости в битах или байтах, то есть стоимостью хранения одного бита или байта информации.
  Наиболее распространены три технологических типа запоминающих устройств, отличающихся использованием разных физических принципов записи, хранения и считывания информации. Это ЗУ на электронных микросхемах, ЗУ на магнитных носителях информации (магнитные диски, ленты, карты) и ЗУ на оптических носителях информации (оптические диски разных модификаций).
  Важнейшей характеристикой любого типа ЗУ является такое его физическое свойство, как энергозависимость либо энергонезависимость. В энергозависимой памяти информация может быть искажена или потеряна при отключении источника пи­тания. В энергонезависимых ЗУ записанная информация сохраняется и при от­ключении питающего напряжения. Магнитная и оптическая память – энергоне­зависимы. Память на электронных микросхемах может быть как энергозависимой, так и нет, в зависимости от ее типа. Помимо энергозависимости следует также учитывать, приводит ли считывание информации к ее разрушению или нет.
  Основными типами энергозависимой памяти на электронных микросхемах являются статическая память (Static RAM – SRAM) и динамическая память (Dynamic RAM – DRAM). Исторически сложившееся использование аббревиатура RAM – Random Access Memory («память с произвольным доступом») для именования именно этих типов памяти не совсем корректно, поскольку па­мятью с произвольным доступом являются также и другие типы памяти, в частности, энергонезависимые типы ЗУ (см. далее).
  Запоминающим элементом в статической памяти является электронная схема, обычно со­стоящая из четырех или шести транзисторов и называемая триггером. Такой триггер имеет два устойчивых состояния, соответствующих значению бита информации (0 или 1). Любое из состояний триггера сохраняется до тех пор, пока подается питание. Схема с четырьмя транзи­сторами обеспечивает большую емкость всей микросхемы памяти в целом, а следовательно, меньшую стоимость, однако у такой схемы относительно большой ток утечки в режиме хранения информации. Кроме того триггер на четырех транзисторах более чувствителен к воздей­ствию внешних источников излучения, которые могут стать причиной потери ин­формации. Наличие двух дополнительных транзисторов позволяет в определенной мере компенсировать указанные недостатки схемы на четырех транзисторах и, глав­ное, увеличить быстродействие памяти.

<< Пред.           стр. 3 (из 12)           След. >>

Список литературы по разделу