Материалы по тегу: cpu

22.09.2023 [20:05], Алексей Степин

Раскрыты подробности о процессорах Intel Xeon Emerald Rapids — упор на память

На конференции Innovation 2023 компания Intel поделилась новыми сведениями о процессорах Xeon пятого поколения. Эти чипы под кодовым именем Emerald Rapids должны прийти на смену Sapphire Rapids. Дебютируют новые процессоры уже 14 декабря, но сведений об их особенностях и отличиях от предыдущего поколения Xeon до этого момента было мало.

Ещё весной этого года Intel начала рассылать инженерные образцы Emerald Rapids избранным партнёрам, однако известно было лишь о том, что наследники Sapphire Rapids получат до 64 ядер при 128 потоках и будут использовать актуальный процессорный разъём LGA 4667.

Источник: Intel via VideoCardz.net

В новом поколении Xeon разработчики явно сделали серьёзный упор на ускорении подсистемы памяти: процессоры Emerald Rapids получат в три раза больше кеша L3, нежели их предшественники, а также получат поддержку более быстрых модулей DDR5. Вернётся интегрированный движок RAID для NVMe-накопителей. Ранее Intel отказалась от технологии VROC, но сейчас решила, что её наличие не будет лишним для новых Xeon.

Благодаря архитектурной оптимизации производительность в пересчёте на Вт вырастет, по словам Intel, на 17 %, а ещё более экономичными новые процессоры должны стать за счёт активного использования различных блоков ускорителей, разгружающих основные вычислительные ядра.

Источник: Intel via VideoCardz.net

Появится официальная поддержка устройств CXL Type 3. К этому классу относятся экспандеры памяти без собственного контроллера, функционирующие за счёт поддержки процессором; такие модули работают и с Sapphire Rapids, но не имеют официальной поддержки.

Серьёзное внимание Intel уделила также вопросам телеметрии и безопасности: новые процессор получат поддержку ряда фирменных технологий, включая новые расширения Trust Domain Extensions (TDX), обеспечивающие конфиденциальность на уровне виртуальных машин.

Intel Xeon Platinum 8580 ES2 с точки зрения CPU-Z, AIDA64, HWiNFO64 и Cinebench 2024. сточник: YuuKi_AnS via VideoCardz.net

Любопытными сведениями поделился и сетевой энтузиаст YuuKi_AnS, ранее рассказавший об инженерных образцах Emerald Rapids. Процессоры действительно получили двухчиплетную компоновку — в распоряжении источника оказался чип Xeon Platinum 8580 ревизии ES2 с 60 ядрами Raptor Cove. Как и ожидалось, все ядра относятся к Р-классу, каждое ядро дополнено 2 Мбайт кеша L2.

Таким образом, подсистема кеша у Emerald Rapids действительно выглядит достаточно внушительно: 120 Мбайт L2 вместе с 300 Мбайт L3 дают в сумме 420 Мбайт. Это должно крайне положительно сказаться на производительности новых Xeon в нейросетевых задачах вроде LLM-инференса.

О частотном потенциале говорить рано — версия ES2 имеет базовую частоту всего 2 ГГц, но, судя по всему, в турборежиме она может подниматься до 4 ГГц. Максимальный TDP, по мнению утилиты HWiNFO64, составляет 350 Вт. Судить всерьёз об Emerald Rapids по результатам тестов Cinebench 2024 и CPU-Z пока не стоит — показатели эти предварительные и финальная версия Xeon Platinum 8580 может продемонстрировать совсем другие цифры.

Постоянный URL: http://servernews.kz/1093467
19.09.2023 [22:19], Алексей Степин

Intel показала 288-ядерный Sierra Forest — процессор с самым большим числом ядер x86

Долгое время компания Intel отставала от AMD в количестве процессорных ядер, сконцентрированных в пределах одного чипа. И хотя паритет не достигнут и по сей день, похоже в ближайшем будущем эта ситуация должна измениться в пользу «синих». Уже в поколении Sierra Forest Intel представит 144-ядерные процессоры Xeon, а в ближайшем будущем компания планирует удвоить количество ядер на CPU и, возможно, в будущем даже утроит их плотность.

В настоящее время компания готовит к выпуску две принципиально разные ветви нового поколения процессоров Xeon. В одной из этих ветвей под кодовым названием Sierra Forest будут применены только энергоэффективные Е-ядра, но их количество будет доведено до 144, что уже больше достигнутого AMD максимума в 128 ядер.

 Источник изображений здесь и далее: Intel via Tom's Hardware

Источник изображений здесь и далее: Intel via (Tom's Hardware)

Но, как сообщил глава компании на мероприятии Intel Innovation 2023, останавливаться на этом разработчики не собираются и Intel уже имеет на руках и собирается выпустить в будущем аналогичный процессор, но уже с 288 ядрами, которые, впрочем, останутся энергоэффективными и однопоточными.

 Сравнение площадей кристаллов Sierra Forest (слева) и Granite Rapids. Источник: Wild_C/X via Tom's Hardware

Сравнение площадей кристаллов Sierra Forest (слева) и Granite Rapids. Источник: Wild_C/X via Tom's Hardware

Это будет достигнуто благодаря новой чиплетной компоновке, на которую Intel переходит в пятом поколении процессоров Xeon Scalable. Использоваться будет та же архитектура Sierra Forest: как известно, 144-ядерные модели этих чипов состоят из трёх тайлов (вычислительного и двух I/O-модулей), так что для реализации варианта с 288 ядрами будет достаточно просто добавить ещё один вычислительный тайл.

 1

Источник: Intel

Xeon Scalable пятого поколения с P-ядрами — Granite Rapids — будет использовать три вычислительных тайла-чиплета. По подсчётам зарубежных коллег-обозревателей, площадь тайла Granite Rapids составляет 598 мм2, а Sierra Forest — 578 мм2. Теоретически Intel может выпустить и трёхтайловый вариант Sierra Forest, что даст невиданные ранее 432 ядра в одном процессоре.

Также компания сообщила о судьбе процессоров Xeon Emerald Rapids, наследников Sapphire Rapids. Эти обновлённые чипы, также построенные на базе техпроцесса Intel 7, должны увидеть свет уже 14 декабря этого года. Чипы на базе более совершенного Intel 3 в лице Sierra Forest и Granite Rapids, напомним, запланированы на первую половину следующего года. Конкурировать им придётся с AMD Turin с ядрами Zen 5. А решения Intel Clearwater Forest на базе Intel 18A появятся лишь в 2025 году.

Постоянный URL: http://servernews.kz/1093284
18.09.2023 [21:55], Алексей Степин

AMD представила процессоры EPYC 8004 Siena — Zen 4c для периферийных вычислений

Компания AMD продолжает экспансию на серверном рынке: сегодня она анонсировала выпуск новой разновидности процессоров EPYC четвёртого поколения — чипы EPYC 8004, известные под кодовым именем Siena. Это энергоэффективные процессоры, предназначенные для применения в сфере периферийных вычислений и телекоммуникационного оборудования.

Архитектурно ничего нового в EPYC 8004 нет — основе лежит тот же дизайн ядер Zen 4c, применяемый в процессорах EPYC Bergamo и позволивший создать AMD первые в мире 128-ядерные процессоры с архитектурой x86. В числе прочего, это означает и наличие поддержки AVX-512.

Источник изображений здесь и далее: AMD

Компания продолжает придерживаться уже хорошо освоенной модели создания новых процессоров путём компоновки вычислительных 5-нм чиплетов CCD вокруг унифицированного 6-нм чиплета IOD, выполняющего роль хаба ввода-вывода. Однако есть и существенные изменения. Так, в процессорах серии Siena была серьёзно усечена подсистема памяти, с 12 до 6 каналов DDR5. Также пострадала подсистема PCI Express, включающая 96 линий PCIe 5.0 вместо 128.

Всё это позволило сделать процессоры компактнее, но потребовало введения нового сокета SP6 с меньшим числом контактов — 4844 против 6096 контактов у SP5. Такой ход позволит снизить себестоимость производства системных плат для EPYC 8004, тем более что поддержки двухпроцессорных конфигураций новые чипы AMD не предусматривают.

Всего в новой серии AMD анонсировала 12 процессоров, с количеством ядер от 8 до 64 (16—128 потоков), в вариациях с настраиваемым теплопакетом и фиксированным в соответствии со стандартом NEBS (Network Equipment-Building System); последний также предусматривает более широкий диапазон рабочих температур (от -5 до +85 °C).

Нельзя, впрочем, сказать, что теплопакет как-то особенно низок даже у младших 8-ядерных моделей — он стартует с отметки 80 Вт (для модели с настраиваемым TDP этот показатель можно снизить до 70 Вт), а в максимальных конфигурациях система охлаждения CPU должна справляться с отводом 175–225 Ватт. Для периферийных систем и телекоммуникационного оборудования этого добиться не всегда просто.

Можно назвать и другие ограничения: так, использование прежнего дизайна IOD-чиплета означает поддержку памяти со скоростью до DDR5-4800, причём лишь при одном модуле DIMM на канал, а поддержка 3DS RDIMM отсутствует, что ограничивает максимальный объём оперативной памяти отметкой 1152 Гбайт (12 × 96 Гбайт RDIMM). Из 96 линий PCIe лишь половина может работать в режиме CXL.

А конкуренция со стороны Intel в этом сегменте будет очень жёсткой: поскольку речь идёт о телекоммуникационном оборудовании, у «синих» имеется готовый стек решений vRAN и отлично подходящие для его запуска процессоры Xeon EE с поддержкой vRAN Boost, а также ещё более экономичные Xeon D-2700 с интегрированным 100GbE-контроллером, поддерживающие третье поколение Quick Assist и полноценные расширения AVX-512 и VNNI/DL.

AMD хочет противопоставить этому «чистую» вычислительную мощность, достигаемую за счёт количества ядер. Это может сыграть решающую роль при использовании программного обеспечения, неспособного использовать все преимущества ускорителей в процессорах Intel. Также потенциальных заказчиков должна привлечь низкая совокупная стоимость владения для систем на базе EPYC Siena, достигаемой за счёт высокой удельной производительности новых процессоров.

Компания сообщает, что процессоры EPYC 8004 уже доступны в новых периферийных серверах таких производителей, как Dell, Lenovo и Supermicro, анонсировала новые решения и Giga Computing. Также поддержали выпуск новых чипов Microsoft Azure и Ericsson. Последняя, напомним, весной этого года подписала с AMD соглашение о разработке открытого RAN-стека, что позволит ей «отвязаться» в своих продуктах от решений исключительно Intel.

Постоянный URL: http://servernews.kz/1093217
15.09.2023 [19:27], Алексей Степин

Intel показала экспериментальный RISC-процессор для DARPA: 528 потоков на 8 ядер + интегрированная фотоника

Многопоточность давно никого не удивляет, ведь большинство современных процессоров поддерживают выполнение минимум двух потоков на ядро, а у IBM есть и ядра с восемью потоками. Но на конференции Hot Chips 2023 компания Intel продемонстрировала нечто принципиально новое в этом смысле — 8-ядерный RISC-процессор, способный одновременно выполнять до 528 потоков, да ещё и с интегрированным оптическим интерконнектом.

Новинка во всех отношениях любопытная: 66 аппаратных потоков на ядро, довольно объёмный кеш первого уровня (192 Кбайт совокупно для инструкций и данных), 4 Мбайт сверхбыстрой SRAM, а также интегрированные фотонные модули, обеспечивающие оптический интерконнект между несколькими процессорами в системе.

Источник изображений здесь и далее: Intel via ServeTheHome

Поводом для разработки столь необычного процессора стало участие Intel в программе DARPA HIVE, подразумевающей создание эффективных решений для применения в крупномасштабных системах графовой аналитики петабайтного масштаба. По энергоэффективности в такого рода задачах новый чип продемонстрировал тысячекратное превосходство над традиционными архитектурами.

Уникальный чип произведён с использованием 7-нм техпроцесса TSMC с 15 слоями металлизации, использует тайловую (чиплетную) компоновку и несёт на борту блоки с интегрированной кремниевой фотоникой Ayar Labs. Состоит новинка из 27,6 млрд транзисторов (1,2 млрд транзисторов на ядро) и имеет площадь 316 мм2. В демонстрируемой версии использована упаковка BGA c 3275 контактами.

Архитектура процессорных ядер — RISC с фиксированной длиной команд. При этом сами ядра реализованы довольно необычно, поскольку каждое ядро содержит как многопоточные конвейеры (16 потоков на конвейер), так и быстрые однопоточные, с восьмикратно более высокой производительностью. Имеется кастомный контроллер DDR5, контроллер PCI Express 4.0 x8, а также 32 высокоскоростных AIB-порта.

Последние как раз и реализуются за счёт чиплетов с интегрированной фотоникой. 32 оптических канала на процессор обеспечивают пропускную способность интерконнекта на уровне 1 Тбайт/с, а топология HyperX допускает масштабирование на уровне более 1 млн процессоров. При этом теплопакет одного чипа составляет всего 75 Вт.

Внутренний межъядерный интерконнект использует меш-сеть с топологией 2D и 16 специальных маршрутизаторов, обеспечивающих высокую I/O-производительность за пределами кристалла. Эти маршрутизаторы работают на частоте 1 ГГц при напряжении 0,75В, имеют задержку всего 4 такта при ширине соединения 25 байт и пропускную способность 64 Гбайт/с на соединение.

Помимо самого процессора, Intel разработала и OCP-шасси, несущее на борту 16 таких процессоров, 512 Гбайт DRAM и оптическую сеть с производительностью до 16 Тбайт/с в каждом направлении. Благодаря наличию 32 высокоскоростных оптических каналов, в пределах стойки возможно подключение по схеме каждый-с-каждым, не требующая применения дополнительных коммутаторов.

Intel не только продемонстрировала работоспособность систем на базе новых процессоров, но и опубликовала результаты тестирования оптического интерконнекта между двумя демонстрационными системными платами. Задержка при этом не превышает 5 нс. Логически общение ядер в соседствующих процессорах ничем не отличается от внутрипроцессорного, хотя и имеет несколько более высокие задержки. При этом обеспечивается практически линейное масштабирование.

Также известны электрические характеристики: в 75-Вт пакете больше половины приходится на фотонику, и лишь 21 % — на вычислительные ядра. Ещё 16 % потребляет контроллер памяти, остальное приходится на тактовые генераторы, маршрутизаторы и внутренний интерконнект.

При разработке и создании этого уникального процессора Intel пришлось решить ряд технических проблем, в частности, обеспечить надёжное и точное подключение оптических волокон, в том числе в процессе сборки чипа. Для обеспечения приемлемого выхода годных чипов в новинке применен ряд специально разработанных для этого материалов.

Постоянный URL: http://servernews.kz/1093110
14.09.2023 [18:34], Сергей Карасёв

AMD выпустила шесть новых процессоров EPYC Milan — спустя 2,5 года после анонса семейства

Компания AMD, по сообщению ресурса Tom's Hardware, без громких анонсов пополнила семейство процессоров EPYC Milan шестью новыми моделями: EPYC 7663P, EPYC 7643P, EPYC 7303P, EPYC 7303, EPYC 7203P и EPYC 7203. Чипы вышли спустя примерно два с половиной года после дебюта соответствующего семейства. Сейчас их постепенно вытесняют более новые AMD EPYC 7004 (Genoa).

Изделия EPYC 7663P и EPYC 7643P фактически представляют собой версии EPYC 7663 и EPYC 7643 для односокетных серверов. Процессор EPYC 7663P насчитывает 56 ядер (112 потоков) с базовой частотой 2,0 ГГц (повышается до 3,5 ГГц). Показатель TDP равен 240 Вт. Цена — $3139. Модель EPYC 7643P имеет 48 ядер (96 потоков) с частотой 2,3–3,6 ГГц, обладает показателем TDP в 225 Вт и стоит $2722. P-версии практически вдвое дешевле своих старших собратьев, рассчитанных на двухсокетные системы.

 Источник изображения: AMD

Источник изображения: AMD

Решения EPYC 7303P и EPYC 7303 располагают 16 ядрами (32 потока) с тактовой частотой 2,4–3,4 ГГц, а их показатель TDP равен 130 Вт. Чипы ориентированы на одно- и двухпроцессорные серверы соответственно. Цена — $594 и $604. Наконец, изделия EPYC 7203P и EPYC 7203 содержат восемь ядер (16 потоков) с частотой 2,8–3,4 ГГц. Величина TDP составляет 120 Вт. Стоят эти модели $338 и $348. Все новые процессоры поддерживают 128 линий PCIe 4.0. Объём кеша L3 равен 256 Мбайт у двух старших версий и 64 Мбайт у четырёх других.

Постоянный URL: http://servernews.kz/1093034
10.09.2023 [20:22], Алексей Степин

Intel показала чиплетные процессоры Xeon Granite Rapids и Sierra Forest без крышек

Компания Intel опубликовала на своём сайте любопытное видео, которое, впрочем, довольно быстро отредактировала — в нём демонстрируются некие процессоры без крышки-теплораспределителя. Судя по всему, речь идёт о новых чипах Xeon под кодовыми названиями Granite Rapids и Sierra Forest, о которых мы не так давно рассказывали читателям.

Как известно, в новом поколении Xeon Intel окончательно отходит от монолитной технологии и переходит на тайловую (чиплетную), в которой модули сшиваются при помощи технологии EMIB, а общаются друг с другом с помощью интерконнекта Intel Modular Mesh Fabric.

Источник изображений здесь и далее: Intel

Тайлов у новых процессоров два вида: вычислительные, которые несут в себе и контроллеры памяти, и тайлы ввода-вывода (I/O), отвечающие за реализацию PCIe, CXL и UPI, а также различных вспомогательных ускорителей.

На кадрах из опубликованного видео хорошо видна «полосатая» структура новых процессоров, в точности соответствующая слайдам, относящимся к Granite Rapids: центральную часть занимает тройка вычислительных тайлов с высокопроизводительными Р-ядрами, а по бокам расположены более тонкие I/O-тайлы, один из которых немного сдвинут относительно других чиплетов.

Другой кадр демонстрирует упаковку чипов, имеющих иную конфигурацию: здесь тайлов всего три, но центральный существенно крупнее, нежели на предыдущих кадрах. Уже известно, что вычислительные тайлы у процессоров Sierra Forest модульные и могут набираться блоками по 2 или 4 ядра, так что речь в данном случае явно идёт об этих CPU, использующих только энергоэффективные Е-ядра.

Судя по всему, производственный цикл новых Intel Xeon успешно запущен. Напомним, официально увидеть свет Granite Rapids и Sierra Forest должны в следующем году.

Постоянный URL: http://servernews.kz/1092819
06.09.2023 [19:20], Алексей Степин

Первые бенчмарки NVIDIA Grace Superchip: не хуже EPYC и быстрее Xeon, а по энергоэффективности намного лучше AMD и Intel

144-ядерный Arm-процессор NVIDIA Grace Superchip был продемонстрирован публике ещё весной этого года на конференции GTC 2023. Несмотря на то, что технические характеристики этого решения известны уже давно, первые результаты тестирования компания решила опубликовать только сейчас, вероятно, с подачи Arm, которая готовится к IPO. Производство Grace Superchip уже запущено, а появления ОЕМ-систем на его базе следует ожидать уже во II квартале 2024 года.

Напомним, Grace Superchip представляет собой сборку из двух чипов Grace, каждый из которых включает 72 ядра Arm Neoverse V2 (Arm v9) с поддержкой векторных расширений SVE2. Процессор умеет работать с форматами BF16/INT8 и развивает до 7,1 Тфлопс в режиме FP64. С точки зрения системы сборка представляется единым 144-ядерным процессором.

 Grace Superchip. Источник изображения: NVIDIA

Сборка Grace Superchip. Источник изображения: NVIDIA

В качестве соперников Grace Superchip были избраны платформы на базе AMD EPYC Genoa 9654 (2 процессора, 192 ядра) и Intel Xeon Sapphire Rapids 8480+ (также 2 процессора, 112 ядер). Итог довольно любопытен: несмотря на заметное отставание в количестве ядер от системы AMD, решение NVIDIA сумело достичь паритета в подавляющем большинстве тестов, а в сценарии аналитики графов даже продемонстрировало 1,4-кратное превосходство.

Источник изображения: NVIDIA

Возможно, тут новинке помогла мощная подсистема памяти: Grace Superchip оснащается набором чипов LPDDR5x объёмом 960 Гбайт с совокупной ПСП 1 Тбайт/с. Но куда интереснее результаты, приведённые к уровню энергопотребления — сборка Grace Superchip буквально разгромила решения на базе x86-64. Выигрыш в этом случае составил от 70 % до 150 %!

Полученные результаты достаточно неплохо согласуются с официальными данными об энергопотреблении систем-участниц тестирования — это 720 и 700 Вт у решений AMD и Intel соответственно против 500 Вт у NVIDIA Grace Superchip. Если опубликованные сегодня результаты будут подтверждены независимыми тестами, можно говорить о появлении у серверных решений x86 серьёзнейшего конкурента. Впрочем, ценовая политика NVIDIA в отношении Grace Superchip пока остаётся тайной.

Постоянный URL: http://servernews.kz/1092629
30.08.2023 [22:00], Алексей Степин

Тектонический сдвиг: Intel рассказала о конструкции и особенностях Xeon Granite Rapids

На конференции Hot Chips 2023 компания Intel сообщила довольно подробные сведения об архитектуре 144-ядерных Xeon Sierra Forest. Одновременно была опубликована достаточно детальная информация об особенностях чипов Granite Rapids.

Intel уже давно испытывала проблемы с масштабированием процессоров, выполненных по традиционной технологии с монолитным кристаллом. В четвёртом поколении Xeon Scalable (Sapphire Rapids) видны зачатки модульного подхода в XCC-версиях процессоров, использующих «сшивку» четырёх 15-ядерных тайлов (чиплетов) с помощью EMIB. Однако лишь в следующем поколении, к которому относятся и Sierra Forest, и Granite Rapids, модульность будет реализована в полной мере.

Источник изображений здесь и далее: Intel via ServeTheHome

Новый подход Intel во многом напоминает тот, что применяет в своих процессорах AMD, но имеет ряд присущих только ему особенностей. К примеру, Intel решила оставить контроллеры памяти в составе вычислительных чиплетов, поэтому IO-чиплеты работают только с PCI Express и CXL, а также служат местом размещения различных ускорителей, таких, как DSA, IAA, QAT и DLB.

Стоит отметить универсальность портов I/O-тайла. Они могут конфигурироваться как UPI, PCIe или CXL. При этом возможны разные режимы бифуркации, включая смешанную работу PCIe и CXL в пределах одного контроллера. Интерфейс UPI работает на скорости 24 ГТ/с, что в 1,8 раза быстрее, нежели в прошлом поколении, а связь с блоками ускорителей позволяет передавать 64 байта за такт, то есть вдвое быстрее, чем у предыдущих Xeon.

Сшиваются компоненты новых Xeon по-прежнему с помощью EMIB, отвечающей, в том числе, за проброс интерконнекта Intel Modular Mesh Fabric. Каждый чиплет получит свои средства управления электропитанием, но ведущим будет лишь один контроллер, который и будет отвечать за этот процесс. Сама фабрика интерконнекта логически монолитна и обеспечивает в рамках одного процессорного разъёма полноправный и равноценный доступ компонентов друг к другу. Модульность же позволяет варьировать число столбцов и строк меш-сети внутри каждого кристалла.

Напомним, что ядро получит «кусок» кеша LLC (для Granite Rapids — 4 Мбайт), но в составе всего процессора эти блоки образуют единый раздел LLC большого объёма с возможностью разбиения на кластеры для каждого NUMA-узла.

Вычислительные чиплеты Granite Rapids получат только P-ядра Redwood Cove. Производятся они с использованием процесса Intel 3, а значит, «прыжок» через техпроцесс (Sapphire Rapids использует Intel 7) даст ещё больший выигрыш в энергоэффективности. Поскольку речь идёт о Р-ядрах, Granite Rapids будет обладать поддержкой всех современных расширений и форматов вычислений, включая AVX-512 и AMX. Последний сможет работать с форматом FP16.

Некоторые улучшения микроархитектуры найдут своё место в новых ядрах: они получат 64 Кбайт кеша инструкций, более продвинутые механизмы предсказания ветвлений и восстановления конвейера при «промахе», поддержку умножения чисел с плавающей запятой за три такта (ранее требовалось до пяти), а также новые средства работы с памятью (в частности, можно более тонко контролировать, что будет попадать в L2-кеш) и продвинутые средства управления питанием.

К вопросу о памяти: от Sapphire Rapids новые Xeon с P-ядрами будет отличать поддержка стандарта MCR (Multiplexer Combined Ranks) DIMM. Как утверждает не только Intel, но и SK hynix, уже демонстрировавшая соответствующие модули, MCR DIMM станет самой быстрой серверной памятью. Со скоростью 8800 МТ/с на модуль и при 12 каналах Intel заявляет, что производительность подсистемы памяти у Granite Rapids будет выше, нежели у Xeon Max, оснащённых HBM2e, обычные же Sapphire Rapids она превзойдёт в 2,5 раза.

Конечно же, не забыла Intel и о поддержке CXL, благо, концепция «выносной» памяти становится всё более и более популярной. Новые процессоры получат полноценную поддержку устройств памяти CXL Type-3, которой нет у Sapphire Rapids. Будут реализованы средства многоуровневого распределения (tiering), как аппаратные, так и программные, причём аппаратное распределение полностью прозрачно для ПО.

В отличие от Sierra Forest, Granite Rapids станет основой для серверов и систем, ориентированных не только на горизонтальное масштабирование, но и на вертикальное. Поэтому один сервер может объединить до 8 процессорных разъёмов, и такая платформа отлично подойдёт для любых сценариев, где требуется высокая производительность в пересчёте на ядро, включая сценарии ИИ и HPC. А поможет мощным Р-ядрам развитая подсистема памяти с поддержкой MCR DIMM и CXL.

Постоянный URL: http://servernews.kz/1092304
29.08.2023 [22:18], Алексей Степин

Intel поделилась некоторыми подробностями о 144-ядерных Xeon Sierra Forest

На конференции Hot Chips 2023 корпорация Intel рассказала о новых чипах Xeon, в том числе о создаваемых специально под нужды гиперскейлеов процессорах Sierra Forest. Они не только получат чиплетную компоновку и до 144 ядер на CPU, но и будут обладать рядом архитектурных особенностей, делающих эти процессоры уникальными.

Стоит начать с того, что подход, применённый к Sierra Forest, кардинально отличается от подхода AMD, которая в процессорах EPYC Bergamo просто применила оптимизированные по площади кристалла ядра Zen 4c. Архитектурно эти ядра во всём подобны Zen 4, хотя и лишены некоторых возможностей.

 Изображения: Intel (via ServeTheHome)

Изображения: Intel (via ServeTheHome)

Совсем другое дело Sierra Forest — это первые Xeon, построенные на базе исключительно энергоэффективных Е-ядер, базирующихся на микроархитектуре под кодовым названием Crestmont (Sierra Glenn). И эта архитектура, в основе которой лежит техпроцесс Intel 3, изначально оптимизирована с учётом достижения максимальных энергоэффективности и горизонтальной масштабируемости.

Intel говорит о 2,5-кратном превосходстве в плотности упаковки в пересчёте на стойку и 2,4-кратном преимуществе в производительности на Вт в сравнении с Sapphire Rapids. Новые E-ядра могут быть сгруппированы в кластеры по 2 или 4 ядра, в отличие от Gracemont, не поддерживающего кластеризацию менее чем по 4 ядра.

В зависимости от компоновки и модели, таким образом, 4 Мбайт общего кеша L2 может приходиться на те же 2 или 4 ядра, что позволит заказчикам выбрать процессор с учётом используемых сценариев: с максимизацией количества ядер, либо с меньшим числом ядер, но с более высокой производительностью на ядро.

Новые ядра нельзя назвать упрощёнными: они характеризуются развитыми подсистемами фронт- и бэкэнда, довольно объёмным кешем инструкций (64 Кбайт), сдвоенным внеочередным декодером, способным декодировать до 6 инструкций за такт, и конвейером, рассчитанным на выполнение до 8 микроопераций за такт. Также реализован достаточно продвинутый механизм предсказания ветвлений с высокой глубиной хранения истории, причём вмещает этот механизм достаточно объёмные структуры.

Следует отметить, что поддержки Hyper-Threading новые ядра не имеют, поэтому количество одновременно исполняемых потоков не превысит 144, что меньше, нежели у AMD Bergamo, где наличие такой поддержки позволяет говорить о 256 потоках. Однако в поддержке актуальных наборов инструкций и форматов данных Intel будущим чипам Sierra Forest не отказала.

Новые процессоры научатся работать с BF16, а также поддерживают продвинутые наборы инструкций вроде AVX-IFMA и AVX-DOT-PROD-INT8, однако не AVX-512. Не будет и матричных расширений AMX — два последних набора останутся прерогативой P-ядер Redwood Cove. Впоследствии Intel планирует сгладить эту разницу с помощью AVX10, но не в поколении Sierra Forest. В качестве мер по обеспечению повышенной безопасности в новых Е-ядрах реализованы технологии Intel CET, VT-rp, поддерживаются доверенные домены (технология Trusted Domain Extensions, TDX), а также расширения SGX.

Базовой единицей компоновки Sierra Forest станет тайл, содержащий 2 или 4 ядра, 4 Мбайт кеша L2, а также «кусок» (slice) кеша LLC объёмом 3 Мбайт. LLC делится между всеми ядрами в процессоре, но его также можно будет разбить на кластеры для отдельных NUMA-узлов. Сшивка тайлов в чиплет будет осуществляться за счёт логически монолитной, но при этом модульной меш-сети, за связь же чиплетов между собой отвечают мостики EMIB.

По краям чиплета расположится подсистема памяти — контроллеры DDR5-6400. В этом тоже есть отличие от подхода AMD. В случае Sierra Forest и Granite Rapids IO-тайл будет одинаковым для обоих процессоров, но он не будет содержать контроллеры памяти, а лишь HSIO-линии (PCIe 5.0, UPI) и некоторую другую обвязку. К слову, оба Xeon нового поколения, наконец, станут полноценными SoC.

На уровне платформы Sierra Forest будет поддерживать только двухпроцессорные конфигурации, что ограничит максимальную конфигурацию системы 288 ядрами. Платформу Birch Stream они будут делить с Granite Rapids, но последние получат поддержку 8S-конфигураций. Теплопакет Sierra Forest, согласно опубликованным слайдам, не превысит 205 Вт на процессор. Это не так уж много — для сравнения, 128-ядерные AMD EPYC Bergamo имеют TDP 360 Вт.

В целом, Sierra Forest чем-то напоминает концепцией решения Ampere Computing — это процессор с максимально возможным в рамках используемого пакета технологий количеством относительно несложных ядер, ориентированный на использование в облачных средах, в т.ч. хорошо подходящий для одновременного запуска множества виртуальных машин.

Однако в отличие от AmpereOne он позволит использовать всё богатство накопленного для платформы x86 программного обеспечения без необходимости пересборки. В сочетании с высокой заявленной энергоэффективностью это может отвлечь внимание потенциальных заказчиков от решений на базе Arm.

Постоянный URL: http://servernews.kz/1092233
29.08.2023 [17:00], Сергей Карасёв

Intel Xeon следующего поколения получат 12 каналов DDR5 и 136 линий PCIe 5.0/CXL 2.0

Корпорация Intel на конференции Hot Chips 2023, по сообщению The Register, рассказала о процессорах Xeon следующего поколения для платформы Birch Stream, известных под кодовыми обозначениями Sierra Forest и Granite Rapids. Эти изделия получат ряд улучшений в плане поддержки оперативной памяти и интерфейсов ввода/вывода. А ещё они, наконец-то, станут полноценными SoC, которые не требуют дополнительной обвязки для старта и работы.

Нынешние чипы Xeon Sapphire Rapids предлагают восемь каналов памяти DDR5-4800 (1DPC) и DDR5-4400 (2DPC), а также 80 линий PCIe 5.0/CXL 1.1. Вместе с тем конкурирующие AMD EPYC Genoa имеют 12 каналов памяти DDR5-4800 и 128 линий PCIe 5.0. При этом с 2DPC у Genoa не всё гладко. Процессоры Xeon следующего поколения обеспечат поддержку DDR5 DIMM и MCR DRAM, причём с поддержкой 2DPC, а также 136 линий PCIe 5.0/CXL 2.0 (с упором на Type-3) и 6 линий UPI. В марте нынешнего года Intel сообщала, что Granite Rapids смогут работать с памятью MCR-8800. Пропускная способность ОЗУ по сравнению с Sapphire Rapids возрастёт практически в три раза.

 Источник изображений: Intel

Источник изображений: Intel

Впрочем, главной особенностью Sierra Forest и Granite Rapids станет полный переход на чиплетную компоновку. В них два IO-тайла, которые и предоставляют HSIO-линии, «сшиты» посредством EMIB с вычислительными тайлами, которых может быть от одного до трёх. Это позволит консолидировать основную функциональность на уровне платформы (Birch Stream), которая едина для обоих процессоров и физически, и электрически, и логически. Впрочем, важное отличие есть: Sierra Forest рассчитаны на одно- и двухсокетные системы, тогда как Granite Rapids поддерживают и 8S-конфигурации.

Чипы Sierra Forest с ядрами E (с высокой энергетической эффективностью) ориентированы на горизонтально масштабируемые рабочие нагрузки, а изделия Granite Rapids с ядрами P (с высокой производительностью) предназначены для приложений с интенсивными вычислениями. При этом компания, несмотря на имеющиеся возможности, не намерена создавать гибридные процессоры с P- и E-ядрами. В случае Sierra Forest компания сосредоточилась на повышении плотности размещения ядер с минимальным ущербом для производительности. Заказчикам на выбор будут доступны два варианта: два или четыре ядра на один блок L2-кеша объёмом 4 Мбайт, причём с возможностью более тонко контролировать, какие данные будут туда попадать.

Процессоры будут изготавливаться по 7-нм технологии Intel 3. В семейство войдут решения, насчитывающие до 144 ядер, но это максимум для Sierra Forest (будут и более простые модели), а вот лимит под ядрам для Granite Rapids так и не был назван. Для Sierra Forest заявлена поддержка BF16 и FP16, а вот AVX-512 они лишены напрочь. Частично упростит унификацию кода для разных процессоров появление AVX10, но полноценно эти инструкции будут реализованы лишь в будущих поколениях. В случае с Granite Rapids упомянута поддержка Advanced Matrix Extensions (AMX) с FP16 для задач ИИ и машинного обучения.

Постоянный URL: http://servernews.kz/1092183
Система Orphus