От Alexei P
К All
Дата 12.07.2000 22:30:55
Рубрики Прочее; Современность;

Новость об отечественном процессоре E2K (Эльбрус-2000)

Научный руководитель отечественной компании "Эльбрус" (
http://www.elbrus.ru), член-корр. РАН Б.А. Бабаян сообщил много новостей о проекте процессора E2K, выступая на конференции HPC Asia 2000 ( http://www.cs.wm.edu/hpcs/HPCAsia2000.html), прошедшей 14-17 мая в Пекине. Конференция посвящена высокопроизводительным вычислениям. В списке ее спонсоров и участников присутствуют все основные западные компьютерный фирмы.

Оказывается, в течение прошедшего года компания Эльбрус активно развивала свой процессор. Напомним, логическое проектирование E2K завершилось в начале прошлого года и компания Эльбрус занялась поисками инвесторов для финансирования следующего этапа - производства опытных образцов. Тогда проект ориентировали на технологический процесс с нормой 0.18 мкм и 6 слоями металлизации. В случае запаздывания финансирования предполагалось перепроектировать процессор на технологию 0.13, а затем на 0.1 мкм.

По-видимому, перенос архитектуры на лучшие технологии уже начат. На конференции Б.А. Бабаян описал несколько новых вариантов E2K для технологий с различными нормами. Самый "медленный" их них рассчитан для технологического процесса с нормой 0.18 мкм, его тактовая частота составляет 1.2 ГГц, площадь кристалла - 360 мм2, рассеиваемая энергия - 55 Ватт, производительность - 155 SPECint95 и 400 SPECfp95. Наиболее совершенный вариант должен быть реализован по технологическому процессу с нормой 0.1 мкм и применением SOI-технологии. Тактовая частота при этом достигнет 3 ГГц, площадь кристалла - 310 мм2, рассеиваемая энергия - 105 Ватт, производительность - 800 SPECint95 и 1150 SPECfp95 (для сравнения, у Pentium III с тактовой частотой 1 ГГц эти показатели равны ~ 46 SPECint95 и 33-36 SPECfp95).

Большое увеличение энергопотребления и площади кристалла по сравнению с первоначальным вариантом связано в основном с увеличением кэш-памяти второго уровня до 2 МБайт для 0.18-микронной технологии и до 4 МБайт - для норм 0.13 и 0.1 мкм. Перенос кэш-памяти объемом в несколько мегабайт на кристалл - общая тенденция в архитектуре перспективных процессоров для серверов и рабочих станций.

Вдобавок к этому, в вариантах для технологий с нормами 0.13 и 0.1 мкм продемонстрированы макроархитектурные новшества. На одном кристалле может размещается до 4 процессорных ядер. Их располагают двумя способами.

В первом случае два ядра с командным словом длиной в 16 слогов (каждый слог представляет собой команду, которая управляет каким-либо процессорным устройством) объединяют в 32-слоговый процессор. Возможно два варианта соединения: синхронное и квази-синхронное. В первом варианте допускается лишь один поток команд. Во втором варианте реализуется технология SMT (Simultaneous MultiThreading - одновременная многопоточность): процессор может переключаться от 1-поточного к 2-поточному варианту и обратно. Подобные технологии используются также в проектах процессоров Sun UltraSPARC-V и Compaq/DEC Alpha 21464. Такая способность очень полезна процессору, если приложение динамически порождает процессы либо потоки.

Во втором случае E2K может работать как 2-х процессорная система над общей кэш-памятью. Если при этом вычислительными узлами этой системы служат 32-слоговые процессоры, на кристалле физически располагается как раз 4 ядра E2K.

Таким образом, в E2K реализованы основные перспективные технологии использования параллелизма приложений.

От quest
К Alexei P (12.07.2000 22:30:55)
Дата 12.07.2000 23:42:22

Re: Новость об отечественном процессоре E2K (Эльбрус-2000)

Hi!
>По-видимому, перенос архитектуры на лучшие технологии уже начат. На конференции Б.А. Бабаян описал несколько новых вариантов E2K для технологий с различными нормами. Самый "медленный" их них рассчитан для технологического процесса с нормой 0.18 мкм, его тактовая частота составляет 1.2 ГГц, площадь кристалла - 360 мм2, рассеиваемая энергия - 55 Ватт, производительность - 155 SPECint95 и 400 SPECfp95. Наиболее совершенный вариант должен быть реализован по технологическому процессу с нормой 0.1 мкм и применением SOI-технологии. Тактовая частота при этом достигнет 3 ГГц, площадь кристалла - 310 мм2, рассеиваемая энергия - 105 Ватт, производительность - 800 SPECint95 и 1150 SPECfp95 (для сравнения, у Pentium III с тактовой частотой 1 ГГц эти показатели равны ~ 46 SPECint95 и 33-36 SPECfp95).

Будте добры, поясните пожалуйста: что такое SPECfp95 и SPECint95.

Best regards, Quest.

От Alexei P
К quest (12.07.2000 23:42:22)
Дата 13.07.2000 10:52:46

Re: SPECfp95 и SPECint95

SPECfp95 и SPECint95 - стандартные наборы тестовых программ для измерения производительности вычислительных систем.
Производительность - за какое время выч.система исполняет какое-нибудь приложение. Куча фирм договорилась, что стандартынми приложениями для измерения производительности рабочих станций и серверов станут SPECfp95 и SPECint95.

Набор SPECfp95 должен отражать производительность выч.системы на типичном приложении с вещественной арифметикой. Этот набор включает в себя 10 программ (разнообразные численные методы, например решение уравнения Навье-Стокса, метод Монте-Карло). Время выполнения каждой программы измеряется, получается 10 показателей, от них берется среднее геометрическое - это и есть значение SPECfp95.


Набор SPECint95 должен отражать производительность выч.системы на типичном целочисленном приложении. Этот набор включает в себя 8 программ (например, компилятор gcc, игра Го, архиватор). Время выполнения каждой программы измеряется, получается 8 показателей, от них берется среднее геометрическое - это и есть значение SPECint95.

Это я изложил официальную версию (подробнее см
http://www.spec.org/osg/cpu95/qanda.html), что такое SPECint95 и SPECfp95. Переходим к неофициальной.

По мнению многих специалистов, SPECint95 не отражает производительность сервера либо рабочей станции на типичном целочисленном приложении. Одна из причин в том, что на показатель SPECint95 практически не влияет подсистема ввода-вывода (шина, короче). Среди спецов довольно распространено использовать не абсолютную величину SPECint95, а соотношение SPECint95/MHz для оценки "ума" процессора (и компилятора).

А для того чтобы выяснить, как у машины работает подсистема ввода-вывода, смотрят на показатель SPECfp95 - программы, реализующие численные методы, довольно активно работают с памятью.

Другая причина SPECint95 - в его составе только 32-разрядные приложения. Между тем, многие современные приложения (те же СУБД) требуют 64-разрядной целочисленной арифметики.


Для наглядности разберем пример.

В связи со всем вышеизложенным, так называемый высокопроизводительный процессор "Pentium III Xeon" не подходит для установки в системы верхнего уровня, несмотря на заверения Intel.

Он, во-первых, 32-разрядный, что уже сильно ограничивает его область применения. Во-вторых, показатель в 36 SPECfp95 на частоте 1 ГГц свидетельствует о дохлой подсистеме ввода-вывода. В третьих, показатель 46 SPECint95/1000 МГц = 0.046 свидетельствует о некоторой туповатости либо процессора, либо компилятора, либо и того и другого вместе. Для сравнения, у Alpha 21264 SPECint95/MHz = 0.06, у IBM POWER3-II - 0.065. У разных вариантов E2K - от 0.117 до 0.267 что свидетельствует о небывалом уме и сообразительности.


С уважением,
--
Алексей

>> производительность - 800 SPECint95 и 1150 SPECfp95 (для сравнения, у Pentium III с тактовой частотой 1 ГГц эти показатели равны ~ 46 SPECint95 и 33-36 SPECfp95).
>
>Будте добры, поясните пожалуйста: что такое SPECfp95 и SPECint95.

>Best regards, Quest.

От Никита Каменский
К Alexei P (13.07.2000 10:52:46)
Дата 14.07.2000 00:01:18

Re: SPECfp95 и SPECint95

Приветствую!

>А для того чтобы выяснить, как у машины работает подсистема ввода-вывода, смотрят на показатель SPECfp95 - программы, реализующие численные методы, довольно активно работают с памятью.

Там поди еще данные длинными массивами представлены, так что чем шире шина, тем SPECfp95 больше. Кабы не линейная зависимость была :)

>В связи со всем вышеизложенным, так называемый высокопроизводительный процессор "Pentium III Xeon" не подходит для установки в системы верхнего уровня, несмотря на заверения Intel.

Вы про цену забыли. В системы "верхнего уровня" за соответствующую цену прекрасно подходит.

>Он, во-первых, 32-разрядный, что уже сильно ограничивает его область применения.

Хм... Так много софта которому позарез нужна 64-битная целочисленная арифметика ?

>Во-вторых, показатель в 36 SPECfp95 на частоте 1 ГГц свидетельствует о дохлой подсистеме ввода-вывода.

Ну еще бы. 512 бит + crossbar switch это конечно было бы хорошо, только вот цена у всех систем с подобного вида штучками соответствующая.

>В третьих, показатель 46 SPECint95/1000 МГц = 0.046 свидетельствует о некоторой туповатости либо процессора, либо компилятора, либо и того и другого вместе.

Старость не в радость :)

>Для сравнения, у Alpha 21264 SPECint95/MHz = 0.06, у IBM POWER3-II - 0.065.

А из той же ценовой категории можно что-нибудь ? На те бабки что RS/6000 SP стоит можно такую кучу Xeon'ов купить...

>У разных вариантов E2K - от 0.117 до 0.267 что свидетельствует о небывалом уме и сообразительности.

Тут только одна проблема - бумажное состояние E2K, в отличии от всех вышеперечисленных товарищей. И насколько я понимаю в самом благоприятном случае до серии минимум три года.

Кстати, а Вы не в курсе как у E2K с чипсетами, памятью и т.п. ???