МГТУГА

Категории раздела

История воздухоплавания [31]

Системное программное обеспечение [55]

Сети 3-4 курс [41]

Методы и средства защиты информации [17]

Вычислительный системы [42]

про САПР [41]

Безопасность жизнедеятельности. БЖД. [46]

Интернет-технологии ГА [49]

Статистика
Онлайн всего: 2 Гостей: 2 Пользователей: 0

Форма входа

Каталог статей

Главная » Статьи » Вычислительный системы

16.2 Суперскалярность.

16.2 Суперскалярность. Суперскалярность - это способность выполнять одновременно несколько команд за такт (в К6 - до 6); внеочередное выполнение означает выполнение команд не обязательно в той последовательности, в какой они встречаются в коде программы; спекулятивное выполнение означает выполнение команды, расположенной в коде программы после условного перехода в той его (кода) ветви, которая предсказана аппаратурой. Спекулятивным оно называется потому, что предсказание может быть неверным, и тогда команду выполняли зря. Итак, использование конвейера команд позволяет в лучшем случае снизить показатель CPI до 1, то есть на каждом такте с конвейера должна «сходить» новая обработанная команда. В этом случае производительность нашего процессора ARC должна увеличиться в 4 раза, при его длительности такта в 10 нс (тактовая частота 100 Мгц) имеем производительность в 100 MIPS. Но во-первых, у Celeron такой показатель равняется, как мы выяснили, где-то 250, а во-вторых – как показано ранее, достижение показателя 1 CPI не всегда возможно из-за конфликтов при конвейеризации. То есть реально мы будем иметь в лучшем случае 1,5-2 CPI. Как же достигается такая высокая производительность в Celeron и других процессорах с архитектурой P6? Для этого в них используется суперскалярная обработка, то есть обработка с многопотоковым конвейером команд, когда процессор может выполнять больше 1 команды за такт (CPI < 1, или – IPC > 1). Фактически в суперскалярном процессоре несколько потоков проходят через несколько исполнительных устройств, а остальные ступени так или иначе работают с одним потоком. Для согласования разных скоростей потоков декодирования, выборки, трансляции в RISC - подобные инструкции, переупорядочивания и потоков в исполнительных устройствах применяют различные очереди инструкций (буферы FIFO), которые есть у каждого из исполнительных устройств Необходимо отметить, что в суперскалярных процессорах происходит очень сложное и нетривиальное преобразование последовательного потока команд исходной программы в параллельный поток триад (операция + операнды + назначение результата), параллельно продвигающихся по очередям команд в исполнительные устройства. Процессор ограничен в возможностях такого преобразования, а также в возможностях спекулятивного исполнения (подготовки загрузки альтернативных ветвей ветвления) и прогнозирования ветвлений размером т.н. «окна исполнения», то есть той частью программного кода, который процессор «видит» в процессе выполнения в данном такте. Все это ограничивает возможности распараллеливания потоков команд до величин порядка 6-8 (что тоже в принципе неплохо)
1 2 3 4 5 Категория: Вычислительный системы \| Добавил: mgtuga (15.01.2010)
Просмотров: 2097 \| Рейтинг: 0.0/0

Всего комментариев: 0

Поиск

Дисциплины
Системное программное обеспечение История воздухоплавания Сети ЭВМ и телекоммуникации Методы и средства защиты информации Вычислительные системы КТОП ЭВМ