Архитектура Intel Core
Впервые детальные подробности об архитектуре процессоров Core (ранее - Architecture 101) были озвучены на весенней сессии Форума Intel для разработчиков - IDF Spring 2006. Грубо говоря, архитектура Core 2 Duo является логическим развитием архитектуры Pentium Pro с использованием всех технологий и наработок Intel. В частности новые процессоры имеют довольно короткий конвейер (14-стадий) и способны декодировать и исполнять до 4 инструкций за один такт. Новое ядро Conroe содержит 291 млн. транзисторов, а его площадь равна 144 кв. мм. В рамках архитектуры Core существуют два основных течения: Intel Core 2 Extreme и Intel Core 2 Duo для настольных ПК.
Основные особенности архитектуры Intel Core
Архитектура Intel Core стала основой для процессоров всех сегментов рынка – настольных ПК (Conroe), мобильных ПК (Merom) и серверов (Woodcrest).
Новые чипы на базе архитектуры Intel Core обещают значительный прирост производительности - от 40% для Conroe до 80% для Woodsrest, при одновременном снижении энергопотребления на 35-40%. Новая процессорная архитектура наследует философию эффективного энергопотребления, впервые реализованную в процессорах Intel Pentium M для мобильных ПК на ядре Banias. В новом поколении возможности процессоров улучшены не только благодаря совершенно новым технологиям, но также за счет использования наработок, с успехом применявшихся в чипах с архитектурой Intel NetBurst. И всё же ключевая роль отводится инновациям, впервые реализованным в новом поколении процессорной архитектуры Intel:
- Технология Intel Wide Dynamic Execution призвана обеспечить выполнение большего количества команд за каждый такт, повышая эффективность выполнения приложений и сокращая энергопотребление. Каждое ядро процессора, поддерживающего эту технологию, теперь может выполнять до четырех инструкций одновременно с помощью 14-стадийного конвейера.
- Технология Intel Intelligent Power Capability, активируя отдельные узлы чипа только по мере необходимости, значительно снижает энергопотребление системы в целом.
- Технология Intel Advanced Smart Cache подразумевает наличие общей для всех ядер кэш-памяти L2, совместное использование которой снижает энергопотребление и повышает производительность. При этом, по мере необходимости, одно из ядер процессора может использовать весь объём кэш-памяти при динамическом отключении другого ядра.
- Технология Intel Smart Memory Access повышает производительность системы, сокращая время отклика памяти и оптимизируя, таким образом, использование пропускной способности подсистемы памяти.
- Технология Intel Advanced Digital Media Boost позволяет обрабатывать все 128-разрядные команды SSE, SSE2 и SSE3, широко используемые в мультимедийных и графических приложениях, за один такт, что увеличивает скорость их выполнения.
Буквенный индекс в начале маркировки классифицирует тепловыделение процессора, без всякого соотношения с форм-фактором:
- X - более 75 Вт
- E - от 50 Вт и выше
- T - в пределах 25 Вт – 49 Вт
- L - в пределах 15 Вт – 24 Вт
- U - порядка 14 Вт и менее
В свою очередь 4-значный цифровой индекс также несёт смысловую нагрузку. В общем случае, чем большее 4-значное число представлено маркировкой процессора, тем большей производительностью и энергопотреблением он характеризуется. В то же время первая цифра означает принадлежность чипа к определённому семейству продуктов, вторая цифра – соответствующий расклад чипов внутри семейства. Соответственно, чем больше цифра, тем производительнее чип. Итак, с августа 2006 года в магазинах появились следующие семейства процессоров:
Процессор | Ядро | Тактовая частота, ГГц | Множитель | Частота шины, МГц | Размер L2 кеша, Мб | Типичное тепловыделение, Вт |
---|---|---|---|---|---|---|
Core 2 Extreme X6800 | Conroe | 2,93 | 11 | 1066 | 4 | 75 |
Core 2 Duo E6700 | Conroe | 2,67 | 10 | 1066 | 4 | 65 |
Core 2 Duo E6600 | Conroe | 2,4 | 9 | 1066 | 4 | 65 |
Core 2 Duo E6400 | Allendale | 2,13 | 8 | 1066 | 2 | 65 |
Core 2 Duo E6300 | Allendale | 1,86 | 7 | 1066 | 2 | 65 |
Core 2 Duo E4300 | Allendale | 1,80 | 9 | 800 | 2 | 65 |
Работающие в штатном режиме процессоры Conroe и Allendale имеют очень низкое, по современным меркам, тепловыделение. В частности младший процессор E6300 при частоте 1,86 ГГц имеет типичное тепловыделение = 65 Вт. Немалую роль здесь сыграл очень тонкий (65 нм) техпроцесс, а также относительно невысокое напряжение питания. А при включенной технологии Enhanced Intel SpeedStep тепловыделение снижается до 22 Вт. При этом множитель снижается до 6, и понижается напряжение Vcore. Остальные процессоры также поддерживают эту технологию, позволяющую снизить множитель до 6. Поэтому для большинства пользователей использование боксового кулера будет достаточным.
Новое поколение двухъядерных процессоров Intel Core 2 требует специально разработанных для них чипсетов LGA 775 и со старыми материнскими платами не работает. К средней ценовой категории можно отнести процессоры Conroe с 2-мегабайтным кэшем L2. В низшую категорию входят Conroe-1M. Кроме того, есть и бюджетная категория, для которой компания Intel представила процессоры Celeron на очередной модификации ядра Conroe-L, которое представляет собой урезанное ядро Conroe. Изменения следующие: частота системной шины понижена до минимума (200 МГц), как и объем кэша L2 (до 512 Кб).
Celeron на ядре Conroe-L
По состоянию дел до сегоднешнего времени, компания Intel предлагает 4-х ядерные процессоры, которые обеспечивают трехкратный прирост производительности в оптимизированных приложениях. Правда, такое ПО еще большая редкость, и подавляющее большинство программ загружают только одно процессорное ядро. Тем не менее, можно утверждать, что на сегодня двухъядерные процессоры являются наиболее сбалансированным решением.
В конце ноября 2007 года Intel выпустила новое 3-е поколение процессоров на общей архитектуре CORE - Intel Penryn на ядрах Yorkfield и Wolfdale, поддерживающее новый набор инструкций SSE4. Первый из них имеет обозначение QX9650.
Ядро Conroe является на сегодняшний момент наиболее совершенным и “продвинутым”, и процессоры на нем легко обходят единственных конкурентов из AMD. В новом процессоре от Intel PenRyn серьезно ускорено выполнение операций деления (как целых, так и вещественных чисел). Модифицированный блок деления получил название Fast Radix-16 (у семейства Core аналогичный блок назывался Radix-4).
Результат - за один проход новый блок обрабатывает 4 бита вместо двух. Еще у Penryn серьезно модифицирован блок отвечающий за исполнение потоковых команд. На этот шаг инженеры Intel пошли, поскольку в новых процессорах реализован дополнительные набор инструкций SSE4.1. Однако, обычный домашний пользователь никакой разницы в скорости между процессорами Core и Penryn не заметит. Да, Penryn работает чуть быстрее за счет более “зрелой” архитектуры, но в обычном, неоптимизированном программном обеспечении эта разница будет составлять несколько процентов. Другое дело - оптимизированное ПО. Для начала оптимизация под многоядерность. Если она есть, то прирост производительности 4-ядерного процессора по сравнению с условным одноядерным (работающем на такой же частоте, и имеющий ту же архитектуру) может колебаться от 200% до 400%! А оптимизация под использование инструкций SSE4.1 обеспечивает преимущество Penryn над Core до 30% при одной и той же частоте. В общем, семейство процессоров Penryn является эволюционным развитием семейства Core, причем благодаря 45 нм техпроцессу практически все характеристики улучшены (кроме скорости доступа к кешу L2). Иными словами, процессоры Yorkfield и Wolfdale лучше своих предшественников (Kentsfield и Conroe соответственно), и естественно будут пользоваться успехом. Слагаемые успеха просты: модифицированное ядро Conroe + поддержка инструкций SSE4.1, более “тонкий” 45 нм техпроцесс (лучше разгон, меньше тепловыделение) и увеличенный объем кеш памяти второго уровня (до 6/12 Мб). Приобрести двух и четырехъядерные процессоры семейства Penryn, предположительно, можно будет в начале 2008 года. Новые процессоры Penryn лучше всех своих предшественников не только за счет усовершенствований, но и за счет собственно 45 нм техпроцесса. Напряжение ядра стало меньше, тепловыделение меньше, а потенциал тактовой частоты - выше. Однако, Intel не спешит наращивать частоты: известно только о запланированном достижении частот 3,0 - 3,33 ГГц. А возможно при переходе на 400МГц шину, мы увидим процессор с частотой 3,6 ГГц. Но это будет к концу 2008 года. Именно до этого срока запланировано время жизни семейства Penryn, после которого на сцене появится совершенно новая архитектура Nehalem со встроенным контроллером памяти (топовые процессоры будут иметь 8 ядер и одновременно исполнять 16 потоков!). Тогда же Intel точно перейдет на 32 нм техпроцесс.