Компания Intel только что представила новую информацию о своих процессорах Clearwater Forest «E-Core» Xeon следующего поколения с 288 ядрами, основанных на технологическом узле 18A.
Представлен первый процессор Intel Xeon 18A Clearwater Forest с 288 вычислительными ядрами, полная модернизация с 12 вычислительными чиплетами
Семейство процессоров Intel Xeon следующего поколения, работающее только на базе E-Core, под кодовым названием Clearwater Forest, скоро появится на серверах. Подобно тому, как линейка Xeon 6 была разделена на версии P-Core и E-Core, такие как Granite Rapids и Sierra Forest, мы увидим семейство процессоров Xeon следующего поколения в линейках P-Core Diamond Rapids и Clear Water Forest, работающих только на базе E-Core. Семейство процессоров P-Core оптимизировано для повышения производительности и подходит для ресурсоёмких вычислительных задач и задач искусственного интеллекта, в то время как семейство процессоров E-Core оптимизировано для повышения эффективности и подходит для задач с высокой плотностью и горизонтальным масштабированием.

В презентации Hot Chips 2025 компания Intel отметила, что процессоры Clearwater Forest Xeon будут производиться на новейшем и самом мощном техпроцессе компании 18A, который также используется в клиентских процессорах Panther Lake, ожидаемых к концу этого года. Среди основных особенностей нового процессора Xeon E-Core:
- Новейший технологический узел Intel 18A: улучшенная производительность и энергоэффективность
- Новейшая архитектура Intel Efficiency Core: повышение IPC, оптимизированное для процесса 18A
- Intel Foveros Direct 3D Construction: более короткие, энергоэффективные маршруты, более крупные LLC
- Увеличенная пропускная способность памяти: 12-канальная DDR5-8000

Начиная с технологического процесса, Clearwater Forest от Intel основан на вышеупомянутом узле 18A и использует Backside Metal (по сути, покрывая как верхнюю, так и нижнюю стороны транзистора металлическими слоями для повышения энергоэффективности) в сочетании с Gate-Allaround, что обеспечивает многочисленные преимущества, выходящие за рамки простого масштабирования FET Z.
18A обеспечивает пониженную емкость затвора, что повышает энергоэффективность основной логики, более высокую плотность ячеек с коэффициентом использования ячеек более 90%, улучшенную маршрутизацию сигналов, что помогает уменьшить задержку RC и дополнительно повысить эффективность, и, наконец, обеспечивает подачу питания с низкими потерями, которые снижаются на 4–5%.

Что касается архитектуры, Intel использует для Clearwater Forest свою архитектуру Darkmont E-Core, которая представляет собой обновление Sierra Glen E-Core, используемых в Sierra Forest. Эти ядра обеспечивают:
- Более умный интерфейс
- Более глубокий выход из строя двигателя
- Более масштабное скалярное и векторное исполнение
- Расширенная подсистема памяти

Интерфейс оснащен кэшем инструкций объемом 64 КБ, тремя декодерами инструкций 3-Wide, которые обеспечивают на 50% большую пропускную способность инструкций с девятью декодированиями за цикл, а также гораздо более точным предсказателем ветвлений, возможно, использующим глубокую историю ветвлений и большие размеры структур.

Механизм OOE (Out-of-Order Engine) также обновлён: выделено 8 портов (увеличение на 60%) и изъято 16 портов (увеличение в 2 раза) для обеспечения параллельного выполнения. Размер окна ввода вне очереди увеличен на 60% до 416 блоков, а 26 портов выполнения обеспечивают увеличение на 50% по сравнению с предыдущим поколением.

Модуль выполнения использует 26 портов для обработки различных рабочих нагрузок, а выделенное аппаратное обеспечение обеспечивает повышенную эффективность. Количество блоков целочисленных и векторных вычислений увеличено в 2 раза, количество блоков генерации адресов загрузки — в 1,5 раза, а количество блоков генерации адресов сохранения — в 2 раза.
Подсистема основной памяти получает 50%-ное увеличение производительности до Three-Load, в то время как Two Store остаётся прежним. Более ранняя выдача загрузок может помочь снизить задержку. Глубокая буферизация поддерживает до 128 невыполненных промахов L2 (увеличение в 2 раза). В Clearwater Forest также реализованы усовершенствованные предвыборки, а список специфических функций Xeon E-Core включает:
- Кэш данных L1 ECC
- Поддержка отравления данных
- Проверка восстанавливаемой машины
- Проверка локальной машины
- 52 бита физического адреса
- Core Lockstep

Intel также использует новую модульную архитектуру с процессорами Clearwater Forest Xeon «E-Core». Она включает в себя 4 МБ унифицированной кэш-памяти второго уровня с 17 циклами задержки на четырёхъядерный кластер, что позволяет получить до 288 МБ кэш-памяти второго уровня. Кэш-память второго уровня также обеспечивает значительно более высокую пропускную способность — до 2x, или 400 ГБ/с. Кроме того, на каждый четырёхъядерный кластер (расположенный на базовой плитке) приходится 8 МБ LLC-памяти, а поскольку на кристалле 72 таких кластера, общий объём LLC составляет 576 МБ.
Согласно измерениям, проведённым в SpecIntRate’17, прирост IPC оценивается на 17%. Каждое ядро использует 200 ГБ/с пропускной способности совместно с кэшем L2, а кластеры соединяются между собой посредством межкомпонентного соединения со скоростью 35 ГБ/с.

При создании Clearwater Forest компания Intel полностью перешла на 3D-технологию, используя в общей сложности 12 чиплетов ЦП, изготовленных на технологическом узле 18A. Они размещены на трёх отдельных базовых плитках, включающих Fabric, LLC, контроллеры памяти и ввод-вывод, и основаны на технологическом узле Intel 3. Промежуточный модуль содержит два чиплета ввода-вывода на базе Intel 7 и обеспечивает высокоскоростной ввод-вывод, фабрику и ускорители. Связь обеспечивается решением Intel EMIB для межсоединений.

Итак, в общей сложности:
- 12 чипсетов ЦП E-Core (Intel 18A)
- 3 базовых пакета плиток (Intel 3)
- 2 чиплета ввода-вывода (Intel 7)

В Clearwater Forest также используется монолитная сетчатая структура, которая использует более короткие маршруты, больше металлических ресурсов и высокоплотные межсоединения для повышения энергоэффективности.

В заключение, Intel поделилась некоторыми аспектами производительности решения 2S Clearwater E-Core Xeon. Процессоры поддерживают 12-канальную память DDR5-8000 объёмом до 3 ТБ в двухсокетном сервере и пропускную способность до 1300 ГБ/с. Для сравнения, Intel Sierra Forest поддерживает до DDR5-6400 DRAM по 12 каналам. Платформа поддерживает 2 x 96 PCIe Gen5 и 64 линии CXL, 144 UPI (576 ГБ/с), а решение с 576 ядрами и 1152 МБ LLC обеспечивает производительность до 59 TF/с, что обеспечивает 5000 ГБ/с чистой пропускной способности.
Корпорация Intel также опубликовала результаты анализа стоек с процессорами Intel Xeon 2-го поколения и процессорами Clearwater Forest E-Core. Решение на базе Xeon 2-го поколения, состоящее из 60 серверов (1400 серверов), можно заменить решением на базе Xeon 2-го поколения, состоящим из 20 серверов (180 серверов), что обеспечит снижение энергопотребления парка на 750 кВт, сокращение занимаемого пространства на 71%, повышение эффективности в 3,5 раза и увеличение доли виртуальных ЦП/стойку в 2,31 раза. Значительно снижена совокупная стоимость владения (TCO) благодаря Clearwater Forest.

Ожидается, что семейство процессоров Intel Clearwater Forest Xeon появится в продаже в ближайшие кварталы, так что следите за новостями о более крупном запуске.
Семейства процессоров Intel Xeon (предварительные):
| Семейный брендинг | Даймонд-Рапидс | Клируотер Форест | Гранитные Рапидс | Сьерра-Форест | Изумрудные пороги | Сапфировые пороги | Айс-Лейк-СП | Купер-Лейк-СП | Каскад-Лейк-СП/АП | Skylake-SP |
|---|---|---|---|---|---|---|---|---|---|---|
| Узел процесса | Будет определено | Intel 18A | Intel 3 | Intel 3 | Intel 7 | Intel 7 | 10 нм+ | 14нм++ | 14нм++ | 14 нм+ |
| Название платформы | Intel Oak Stream | Intel Birch Stream | Intel Birch Stream | Intel Mountain Stream Intel Birch Stream | Intel Eagle Stream | Intel Eagle Stream | Intel Уитли | Intel Cedar Island | Intel Purley | Intel Purley |
| Основная архитектура | Panther Cove-X | Даркмонт | Редвуд-Коув | Сьерра-Глен | Бухта Раптор | Золотая бухта | Санни-Коув | Каскадное озеро | Каскадное озеро | Скайлейк |
| Модели MCP (многокристальный корпус) | Да | Да | Да | Да | Да | Да | Нет | Нет | Да | Нет |
| Гнездо | ЛГА XXXX / 9324 | ЛГА 4710 / 7529 | ЛГА 4710 / 7529 | ЛГА 4710 / 7529 | ЛГА 4677 | ЛГА 4677 | ЛГА 4189 | ЛГА 4189 | ЛГА 3647 | ЛГА 3647 |
| Максимальное количество ядер | Будет определено | До 288 | До 128 | До 288 | До 64? | До 56 | До 40 | До 28 | До 28 | До 28 |
| Максимальное количество потоков | Будет определено | До 288 | До 256 | До 288 | До 128 | До 112 | До 80 | До 56 | До 56 | До 56 |
| Макс. кэш L3 | Будет определено | Будет определено | 480 МБ L3 | 108 МБ L3 | 320 МБ L3 | 105 МБ L3 | 60 МБ L3 | 38,5 МБ L3 | 38,5 МБ L3 | 38,5 МБ L3 |
| Поддержка памяти | До 16 каналов DDR5? | До 12 каналов DDR5-8000 | До 12 каналов DDR5-6400 МКР-8800 | До 12 каналов DDR5-6400 | До 8 каналов DDR5-5600 | До 8 каналов DDR5-4800 | До 8 каналов DDR4-3200 | До 6 каналов DDR4-3200 | DDR4-2933 6-канальная | DDR4-2666 6-канальная |
| Поддержка PCIe Gen | PCIe 6.0? | PCIe 5.0 (96 линий) | PCIe 5.0 (136 линий) | PCIe 5.0 (88 линий) | PCIe 5.0 (80 линий) | PCIe 5.0 (80 линий) | PCIe 4.0 (64 линии) | PCIe 3.0 (48 линий) | PCIe 3.0 (48 линий) | PCIe 3.0 (48 линий) |
| Диапазон TDP (PL1) | Будет определено | Будет определено | До 500 Вт | До 350 Вт | До 350 Вт | До 350 Вт | 105-270 Вт | 150 Вт-250 Вт | 165 Вт-205 Вт | 140 Вт-205 Вт |
| 3D Xpoint Optane DIMM | Будет определено | Будет определено | Перевал Донахью | Будет определено | Кроу-Пасс | Кроу-Пасс | Перевал Барлоу | Перевал Барлоу | Апачи Пасс | Н/Д |
| Соревнование | AMD EPYC Венеция | AMD EPYC Zen 5C | AMD EPYC Турин | AMD EPYC Бергамо | AMD EPYC Genoa ~5 нм | AMD EPYC Genoa ~5 нм | AMD EPYC Milan 7nm+ | AMD EPYC Rome 7 нм | AMD EPYC Rome 7 нм | AMD EPYC Naples 14 нм |
| Запуск | 2025-2026 | 2026 | 2024 | 2024 | 2023 | 2022 | 2021 | 2020 | 2018 | 2017 |