RSS    

   Реферат: Процессоры

Подход к использованию интегрированного кэш-контроллера и интерфейса для скоростной кэш-памяти остается неизменным. Представи­тели NexGen говорят, что они изучают возможность использования крис­талла вторичной кэш-памяти по образцу и подобию Intel, тем более что их производственный партнер IBM Microelectronics способен делать статическую память и многокристальные сборки (MCM - multichip modules).

Пример практической реализации технологии МСМ фирмы IBM представляет новая версия процессора Nx586, запланированная к выпус­ку на конец этого года и включающая кристалл CPU и FPU в одном кор­пусе. Одновременное перепроектирование топологии с масштабированием до размера линии 0.35 микрон позволит компании NexGen основательно уменьшить размеры кристалла ЦПУ - до 118 кв. мм - меньше в этом клас­се ничего нет.

NexGen, новичок в группе производителей процессоров х86. Nx596 может параллельно обрабатывать на нескольких исполнительных блоках до четырех простейших операций, которые названы командами RISC86. Процессор К5 имеет похожий четырехпоточный дешифратор, но результаты его работы компания называет R – ops.

4.4. Процессоры Cyrix.

Первая вещь из грандиозного проекта М1 компании Cyrix, нако­нец обнародована. Это процессор Сх 6х86-100, монстроподобный крис­талл которого сложен и очень дорог для того, чтобы претендовать на массовый выпуск в течении длительного срока. Его проблемы сможет ре­шить процессор, который пока имеет кодовое название M1rx и опираю­щийся на техно процесс с пятислойной металлизацией, идущий на смену трехслойной версии той же 0.6-мкм технологии. Если проект увенчает­ся успехом, то размер кристалла с 394 кв. мм уменьшится до 225 кв. мм, тогда у Cyrix появится шанс поднять тактовую частоту до 120 МГц. В этом случае эксперты предсказывают ему производительность в преде­лах 176-203 по тесту SPECint92, т.е. на уровне процессора Pentium 133 (SPECint92=190.9) или 150 МГц. Если все обещания сбудутся, то Cyrix сможет продать столько процессоров, сколько произведет. Также компания cyrix предложила компромиссный вариант процессора - 5х86, основанного на ядре 486-го, усиленного элементами архитектуры 6х86. Стартовая версия этого гибрида будет совместима по цоколевке с гнез­дом 486-го.

4.5. Процессоры Sun Microsystems.

Sun Microsystems процессор UltraSparc-II. Впервые вводя RISC-технологию, SUN в 1988 году объявила SPARC в качестве масштаби­руемой архитектуры, с запасом на будущее. Однако, с 1993 года реали­зация SuperSparc стала на шаг отставать от своих конкурентов.

С появлением UltraSparc, четвертого поколения архитектуры SPARC, компания связывает надежды на восстановление утраченных позиций. Он содержит ни много, ни мало, но девять исполнительных блоков: два целочисленных АЛУ, пять блоков вычислений с плавающей точкой (два для сложения, два для умножения и одно для деления и извлече­ния квадратного корня), блок предсказания адреса перехода и блок загрузки/записи. UltraSparc содержит блок обработки переходов, встроенный в первичную кэш команд, и условно выполняет предсказан­ные переходы, но не может выдавать команды с нарушением их очеред­ности. Эта функция перекладывается на оптимизирующие компиляторы.

Архитектура SPARC всегда имела регистровые окна, т.е. во­семь перекрывающихся банков по 24 двойных регистра, которые могут предотвратить остановки процессора в моменты комплексного переключе­ния, связанные с интенсивными записями в память. Разработчики компи­ляторов склонны считать эти окна недостаточным решением, поэтому в UltraSparc используется иерархическая система несвязанных шин. Шина данных разрядностью 128 бит работает на одной скорости с ядром про­цессора. Она соединяется через буферные микросхемы с 128-разрядной системной шиной, работающей на частоте, составляющей половину, треть или четверть скорости процессорного ядра. Для согласования с более "медленной" периферией служит шина ввода-вывода Sbus.

Фирма Sun реализует эту схему на аппаратном уровне с по­мощью коммутационной микросхемы, являющейся составной частью схемно­го комплекта окружения. Эта микросхема может изолировать шину памя­ти от шины ввода-вывода, так что ЦПУ продолжает, например, запись в графическую подсистему или в иное устройство ввода-вывода, а не ос­танавливается во время чтения ОЗУ. Такая схема гарантирует полное использование ресурсов шины и установившуюся пропускную способность

1.3 Гигабайт/с.

В процессоре UltraSparc – II используется система команд Visual Instruction Set (VIS), включающая 30 новых команд для обра­ботки данных мультимедиа, графики, обработки изображений и других целочисленных алгоритмов. Команды VIS включают операции сложения, вычитания и умножения, которые позволяют выполнять до восьми опера­ций над целыми длинной байт параллельно с операцией загрузки или за­писи в память и с операцией перехода за один такт. Такой подход мо­жет повысить видеопроизводительность систем.

4.6. Процессоры Digital Equipment.

Digital Equipment процессор Alpha наиболее тесно следует в русле RISC-философии по сравнению со своими конкурентами, "посрезав излишки сала" с аппаратуры и системы команд с целью максимального спрямления маршрута прохождения данных. Разработчики Alpha уверены, что очень высокая частота чипа даст вам большие преимущества, чем причудливые аппаратные излишества. Их принцип сработал: кристалл 21164 был самым быстрым в мире процессором со дня своего появления в 1995 году. Процессор 21164 в три раза быстрее на целочисленных вы­числениях, чем Pentium-100, и превосходит на обработке числе с пла­вающей точкой, чем суперкомпьютерный набор микросхем R8000 фирмы Mips. Топология процессора следующего поколения 21164А не измени­лась, но она смаштабирована, кроме того, модернизирован компилятор, что повысило производительность на тестах SPECmarks. Предполагается, что готовые образцы нового процессора, изготовленные по КМОП - техно­логии с нормами 0.35 микрон, при тактовой частоте свыше 300 МГц бу­дут иметь производительность 500 по SPECint92 и 700 по SPECfp92.

Процессоры семейства 21164 на прибегают к преимуществам ис­полнения не в порядке очередности (out – of – order), больше полагаясь на интеллектуальные компиляторы, которые могут генерировать коды, сводящие к минимуму простои конвейера. Это самый гигантский процес­сор в мире - на одном кристалле размещено 9.3 миллиона транзисторов, большая часть которых пошла на ячейки кэш-памяти. Alpha 21164 имеет на кристалле относительно небольшую первичную кэш прямого отображе­ния на 8 Кбайт и 96 Кбайт вторичной. За счет вздувания площади крис­талла достигнута беспрецедентная производительность кэширования.

В 21164 работает четыре исполнительных блока (два для целых и два для чисел с плавающей точкой) и может обрабатывать по две ко­манды каждого типа за такт. Он имеет четырехступенчатый конвейер ко­манд, который "питает" отдельные конвейеры для целых чисел, чисел с плавающей точкой и конвейер памяти. По сравнению с прочими RISC-про­цессорами нового поколения чип 21164 имеет относительно глубокие и простые конвейеры, что позволяет запускать их с более высокой такто­вой частотой.

Конвейер команд вообще не заботится о их зависимости по дан­ным (в отличие от pentium Pro, который является ярким примером маши­ны данных), он выдает команды в порядке их поступления на свой вход (в порядке следования по программе). Если текущие четыре команды не­возможно послать сразу все на различные исполнительные блоки, то конвейер команд останавливается до тех пор, пока это не станет воз­можным. В отличие от конкурентов 21164 также не использует технику переименования регистров, вместо нее он непосредственно обновляет содержимое своих архитектурных регистров, когда результат достигает финальной ступени конвейера – write – back. Для борьбы с задержками и зависимостью команд по данным в процессоре активно ис­пользуются маршруты для обхода регистров, поэтому совместно ис­пользуемые операнды становятся доступными до стадии write - back.

Компания Digital продвигает Альфу как платформу для серве­ров Windows NT, а не как традиционный UNIX-сервер.

4.7. Процессоры Mips.

Mips процессор R1000 унаследовал свой суперскалярный дизайн от R8000, который предназначался для рынка суперкомпьютеров научно­го назначения. Но R1000 ориентирован на массовые задачи. Использова­ние в R1000 динамического планирования команд, которое ослабляет за­висимость от перекомпиляции ПО, написанного для более старых процес­соров, стало возможным благодаря тесным связям Mips со своим партне­ром Silicon Graphics, имеющим богатейший тыл в виде сложных графи­ческих приложений.

R1000 первый однокристальный процессор от Mips. Для предот­вращения остановок конвейера в нем использовано динамическое пред­сказание переходов, с четырьмя уровнями условного исполнения, с ис­пользованием переименования регистров, гарантирующего, что результа­ты не будут передаваться в реальные регистры до тех пор, пока неяс­ность по команде перехода не будет снята. Процессор поддерживает "теневую карту" отображения своих регистров переименования. В слу­чае неверного предсказания адреса перехода он просто восстанавли­вает эту карту отображения, но не выполняет фактической очистки ре­гистров и "промывки" буферов, экономя таким образом один такт.

R1000 отличается также радикальной схемой внеочеред­ной обработки. Порядок следования команд в точном соответствии с программой сохраняется на трех первых ступенях конвейера, но затем поток разветвляется на три очереди (где команды дожидаются обработ­ки на целочисленном АЛУ, блоке вычислений с плавающей точкой и бло­ке загрузки/записи). Эти очереди уже обслуживаются по мере освобож­дения того или иного ресурса.

Предполагаемая производительность R1000, выполненного по КМОП-технологии с нормами 0.35 микрон должна достичь 300 по SPECint92 и по SPECfp92.

Страницы: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14


Новости


Быстрый поиск

Группа вКонтакте: новости

Пока нет

Новости в Twitter и Facebook

                   

Новости

© 2010.