Материалы по тегу: epyc
05.06.2023 [12:28], Сергей Карасёв
Процессоры AMD EPYC Rome перестают функционировать через 1044 дня непрерывной работыСерверные процессоры AMD EPYC 7002 (Rome), по сообщению ресурса Tom's Hardware, «зависают» спустя 1044 дня непрерывной работы — это приблизительно 2,86 года. После этого требуется перезагрузка сервера для восстановления его нормального функционирования. Проблема связана с тем, что ядро названных чипов не может выйти из энергосберегающего режима CC6. Говорится, что конкретные сроки возникновения сбоя могут варьироваться: они зависят от функции Spread Spectrum и опорной частоты REFCLK (используется процессором для отслеживания времени). Однако пользователь Reddit с ником acid_migrain говорит, что на самом деле проблема проявляется через 1042 суток и примерно 12 часов, а не 1044 дня, как предупреждает сама AMD. Дело в том, что счётчик TSC (Time Stamp Counter), работающий на частоте 2800 МГц, зависает при значении 0x3800000000000000. Это 2800 × 106 × 1042,5, то есть, спустя 1042 дня и 12 часов после начала отсчёта. «Здесь слишком много нулей, чтобы это было совпадением», — отмечает acid_migrain. AMD не планирует исправлять ошибку. Избежать сбоя, как уже отмечалось, можно путём периодической перезагрузки сервера. Второй вариант — отключить возможность перехода в состояние CC6. Наблюдатели говорят, что данная особенность EPYC Rome вряд ли будет критична для большинства пользователей: почти три года непрерывной работы — это большой срок, в течение которого, скорее всего, будут выполняться перезагрузки в связи с техническим обслуживанием или обновлениями.
03.06.2023 [15:15], Сергей Карасёв
Дебютировал 4U-сервер ASUS ESC8000A-E12P: два чипа AMD EPYC 9004 и до восьми GPUКомпания ASUS привезла на выставку Computex 2023 сервер ESC8000A-E12P в форм-факторе 4U. Эта GPU-платформа рассчитана на решение задач в области ИИ и HPC: возможна установка восьми полноразмерных двухслотовых ускорителей с интерфейсом PCIe 5.0 x16. Сервер рассчитан на два процессора AMD EPYC 9004 (Genoa) с показателем TDP до 400 Вт. Доступны 24 слота для модулей оперативной памяти DDR5-4800/4400 суммарным объёмом до 6 Тбайт. Возможны два варианта исполнения сервера: с четырьмя тыльными слотами PCIe 5.0 x16 или с тремя слотами PCIe 5.0 x16 и разъёмом OCP3.0 NIC. Во фронтальной части в обоих случаях находится один слот PCIe 5.0 x16. Во фронтальной части находятся восемь отсеков для LFF-накопителей с возможностью горячей замены. Кроме того, может быть установлен SSD формата M.2 22110 с интерфейсом PCIe 3.0 x4. В зависимости от модификации присутствуют два порта 10GbE или 1GbE, а также выделенный сетевой порт управления. В числе опций — контроллер Broadcom MegaRAID 9560-16i, Broadcom MegaRAID 9540-8i, ASUS PIKE II 3008 8-port HBA и ASUS PIKE II 3108 8-port HW RAID. Есть два порта USB 3.2 Gen1, последовательный порт и коннектор D-Sub. Допускается развёртывание системы воздушного и жидкостного охлаждения. Габариты составляют 800 × 440 × 174,5 мм. Устанавливаются три или четыре блока питания мощностью до 3000 Вт с сертификатом 80 PLUS Titanium. Сервер может использоваться в температурном диапазоне от +10 до +35 °C.
02.06.2023 [16:19], Сергей Карасёв
ASUS анонсировала сервер RS500A-E12-RS12U: AMD EPYC 9004 и 16 накопителей SFF в 1U-шассиКомпания ASUS в ходе выставки Computex 2023 представила сервер RS500A-E12-RS12U, предназначенный для поддержания повседневных бизнес-нагрузок. Устройство, выполненное в форм-факторе 1U, использует аппаратную платформу AMD с возможностью установки одного процессора EPYC 9004 (Genoa). Поддерживается работа с чипами в исполнении Socket SP5 (LGA 6096) с показателем TDP до 400 Вт. Доступны 24 слота для модулей памяти DDR5-4800/4400/4000/3600 суммарным объёмом до 6 Тбайт. Предусмотрены три слота PCIe 5.0 x16 и разъём OCP 3.0. Во фронтальной части расположены 12 отсеков для SFF-накопителей SATA/SAS/NVMe. Опционально могут быть добавлены четыре внутренних устройства SFF SATA/NVMe. Кроме того, есть два коннектора для твердотельных модулей M.2. Сервер располагает двухпортовым сетевым контроллером 1GbE на базе Intel I350-AM2 и выделенным сетевым портом управления. Сзади расположены два разъёма USB 3.2 Gen1, интерфейс D-Sub и гнёзда RJ-45 для сетевых кабелей. Габариты составляют 842,5 × 449 × 43,85 мм. Задействованы два блока питания мощностью 1600 Вт с сертификатом 80 PLUS Titanium или 80 PLUS Platinum. Система может эксплуатироваться при температурах от +10 до +35 °C.
24.02.2023 [14:35], Сергей Карасёв
EKWB представила водоблоки для процессоров AMD EPYC GenoaСловенская компания EK Water Blocks, известный разработчик систем жидкостного охлаждения, анонсировала водоблоки серии EK-Pro CPU WB SP5, предназначенные для серверных процессоров AMD EPYC Genoa. Решения уже доступны для заказа на европейском рынке по цене около €155. Одна из новинок, модель EK-Pro CPU WB SP5 Ni + Acetal, ориентирована на рабочие станции. Используются три стандартных фитинга G1/4", которые расположены в верхней части. Основание изготовлено из чистейшей меди с никелевым покрытием. Верхняя часть выполнена из полиформальдегида (ацеталь). Второй водоблок, EK-Pro CPU WB SP5 Rack Ni + Acetal, предназначен для серверов формата 1U. Четыре фитинга стандарта G1/8" расположены в боковых частях. Решение спроектировано таким образом, чтобы полностью покрывать теплораспределяющую пластину процессора в исполнении SP5. Микроребристая структура обеспечивает высокую эффективность отвода тепла. Как и в случае с первой новинкой, основание выполнено из меди с никелевым покрытием, а верхняя часть — из полиформальдегида. Оба водоблока наделены специальным механизмом, исключающим вероятность некорректного монтажа. Благодаря шести подпружиненным винтам обеспечивается оптимальное прижимное усилие. Данный тип крепления позволяет осуществлять установку водоблока без необходимости извлечения материнской платы из корпуса.
10.02.2023 [14:14], Сергей Карасёв
Atos построит суперкомпьютер для Общества Макса Планка на базе новейших AMD EPYC Genoa и Instinct MI300AКомпания Atos объявила о заключении контракта на создание и установку нового высокопроизводительного комплекса для Общества научных исследований имени Макса Планка. В основу системы ляжет суперкомпьютерная платформа BullSequana XH3000 с новейшими процессорами AMD EPYC и ускорителями Instinct. Стоимость проекта превышает €20 млн. Суперкомпьютер будет эксплуатироваться Вычислительным и информационным центром Общества Макса Планка (MPCDF) в Гархинге недалеко от Мюнхена (Германия). Систему планируется применять для решения задач в области астрофизики, биологических исследований, разработки передовых материалов, физики плазмы и технологий ИИ. Комплекс получит систему прямого жидкостного охлаждения (DLC) без вентиляторов. Коэффициент эффективности использования энергии (PUE) составит менее 1,05, что намного ниже по сравнению с другими HPC-установками. В суперкомпьютере будут применяться чипы AMD EPYC Genoa и ускорители Instinct MI300A. Система будет включать 768 процессорных узлов и 192 узла с ускорителями. В состав комплекса войдёт хранилище IBM SpectrumScale. Узлы CPU планируется поставить в III квартале 2023 года, тогда как развёртывание узлов с ускорителями ожидается в первой половине 2024 года. По производительности новый суперкомпьютер в три раза превзойдёт нынешний комплекс Cobra, который используется в MPCDF и также базируется на технологиях Atos. Его пиковое быстродействие достигает 11,4 Пфлопс.
02.02.2023 [01:15], Владимир Мироненко
Чипы EPYC принесли AMD значительную выручку, хотя прибыль упала на 98 %Несмотря на падение продаж ПК, выручка AMD за IV квартал 2022 года выросла в годовом исчислении на 16 % до $5,6 млрд, превзойдя прогнозы экспертов, ожидавших рост до $5,5 млрд. Увеличения выручки удалось добиться в основном благодаря увеличению дохода в сегментах встраиваемых систем и ЦОД, тогда как в клиентском и игровом сегментах наблюдалось снижение выручки. Выручка сегмента ЦОД составила за квартал $1,7 млрд при прогнозе аналитиков $1,6 млрд, что на 42 % больше, чем в прошлом году, причём основным драйвером продаж были серверные процессоры EPYC. Операционная прибыль сегмента равняется $444 млн или 27 % выручки, в то время годом ранее эти показатели были равны $369 млн и 32 % соответственно. Увеличение операционной прибыли было в основном обусловлено более высокой выручкой, часть которой была израсходована на более крупные инвестиции в исследования и разработки. В сегменте встраиваемых систем отмечен рост выручки на 1868 % по сравнению с прошлым годом, составившей $1,4 млрд (прогноз аналитиков — $1,3 млрд), что было достигнуто в основном за счёт включения в этот объём выручки от решений Xilinx. Операционная прибыль составила $699 млн или 50 % выручки, тогда как год назад эти показатели были равны $18 млн и 25 %. Увеличение операционной прибыли и маржи в основном было обусловлено ростом выручки. Выручка клиентского сегмента упала по сравнению с предыдущим годом на 51 % до $903 млн, что было обусловлено сокращением поставок процессоров из-за спада спроса на рынке ПК и значительной корректировки товарно-материальных запасов по всей цепочке поставок. Прогноз аналитиков равнялся $995 млн. Выручка игрового сегмента тоже упала, но не так сильно — на 7 % в годовом исчислении до $1,6 млрд (прогноз аналитиков — $1,5 млрд) из-за более низких продаж игровой графики, частично компенсированных более высокими доходами от полузаказных продуктов. В IV квартале валовая прибыль AMD составила 43 %. Компания сообщила об операционных убытках в размере $149 млн, хотя годом ранее у неё была операционная прибыль $1,2 млрд — это в основном вызвано амортизацией нематериальных активов, в значительной степени связанной с приобретением Xilinx. Чистая прибыль составила $21 млн, что на 98 % меньше прошлогоднего показателя, равного $974 млн. По итогам 2022 года выручка AMD составила $23,6 млрд, что на 44 % показателя 2021 года, равного $16,4 млрд. Валовая прибыль равна 45 %, операционная прибыль — $1,3 млрд, что меньше показателя предыдущего года, равного $3,6 млрд, на 65 %. Чистая прибыль составила $1,3 млрд, сократившись по сравнению с предыдущим годом на 58 %, когда прибыль равнялась $3,2 млрд. Разводненная прибыль на акцию равняется $0,84 — на 67 % меньше показателя 2021 года, равного $2,57. «2022 год был успешным для AMD, поскольку мы продемонстрировали лучший в своём классе рост и рекордную выручку, несмотря на слабую среду ПК во второй половине года», — заявила председатель и гендиректор AMD д-р Лиза Су (Lisa Su). «Несмотря на неоднозначную со спросом, мы уверены в своей способности увеличить долю рынка в 2023 году и обеспечить долгосрочный рост на основе нашего дифференцированного портфеля продуктов», — добавила она. В I квартале 2023 года AMD прогнозирует выручку в размере $5,3 млрд (±$300 млн), что примерно на 10 % меньше, чем в аналогичном периоде прошлого года. Как ожидается, клиентский и игровой сегменты будут сокращаться, что будет частично компенсировано увеличением выручки в сегментах встраиваемых систем и ЦОД. AMD прогнозирует, что в I квартале 2023 года её валовая прибыль (non-GAAP) составит примерно 50 %.
03.12.2022 [13:33], Сергей Карасёв
ASRock Rack представила GENOAD8UD-2T/X550 — одну из самых компактных плат для AMD EPYC GenoaКомпания ASRock Rack анонсировала материнскую плату GENOAD8UD-2T/X550, предназначенную для создания серверов на платформе AMD EPYC Genoa. Новинка на сегодняшний день является одним из самых компактных изделий в своём классе: габариты составляют 264 × 267 мм. Возможна установка одного процессора в исполнении Socket SP5 (LGA 6096). Для модулей оперативной памяти DDR5-4800 есть восемь слотов; максимально поддерживаемый объём ОЗУ — 4 Тбайт. Плата получила по два разъёма MCIO (PCIe 5.0 x8 и PCIe 5.0 x8 или 8 × SATA-3), а также один разъём MCIO PCIe 5.0 x4. Есть четыре слота PCIe 5.0 / CXL1.1 x16, два разъёма M.2 (PCIe 4.0 x4) для твердотельных модулей формата 2280/2260/2242/2230 и коннектор с поддержкой последовательного интерфейса. В оснащение входят BMC-контроллер ASPEED AST2600, два 10GbE-порта (Intel X550-AT2) и выделенный сетевой порт управления (Realtek RTL8211F). Интерфейсный блок содержит три гнезда RJ-45, два порта USB 3.2 Gen1 Type-A и аналоговый разъём D-Sub. Диапазон рабочих температур — от +10 до +35 °C.
14.11.2022 [00:00], Игорь Осколков
Игра по новым правилам: AMD представила Genoa, четвёртое поколение серверных процессоров EPYCВсего за десять лет AMD совершила почти невозможное — практически полностью потеряла серверный рынок, а теперь не просто успешно его отвоёвывает, но и предлагает комплексное портфолио решений. Анонс четвёртого поколения процессоров EPYC под кодовым именем Genoa — это не технологическая победа над Intel, поскольку AMD даже не думала бороться с Sapphire Rapids и уж тем более с Ice Lake-SP, а ориентировалась на Granite Rapids. Но годовая задержка с выпуском Sapphire Rapids позволила AMD не только в более спокойном темпе доделывать чипы Genoa, которые вышли на полгода позже, чем задумывалось ранее, но и поработать с разработчиками и заказчиками. Компании удалось вернуть их доверие — победа в умах гораздо важнее, чем просто технологическое превосходство. А оно неоспоримо. EPYC Genoa заключены в корпус 72×75 мм, содержат до 90 млрд транзисторов и состоят из 13 чиплетов: 12 CCD, изготовленных по 5-нм техпроцессу TSMC плюс один, изрядно увеличившийся в размерах, IO-блок, сделанный там же, но уже по 6-нм нормам. Отказ от услуг GlobalFoundries, которая так и не смогла освоить тонкие техпроцессы, случился как нельзя кстати, поскольку IO-блок становится крайне важным компонентом при таком количестве ядер, которые необходимо вовремя накормить данными. И Genoa интересны в первую очередь с точки зрения полноты и разнообразия IO, а не рекордного количества ядер. IO-чиплет оснащён новыми SerDes-блоками, которые обслуживают и PCIe 5.0, и Infinity Fabric 3.0 (IF/GMI3). Формально каждому чипу полагается 128 линий PCIe 5.0, но реальная конфигурация чуть сложнее. Во-первых, у каждого чипа есть ещё восемь (2 x4) бонусных линий PCIe 3.0 для подключения нетребовательных устройств и обвязки, но в 2S-конфигурации таких линий будет только 12. Во-вторых, для 2S можно задействовать три (3Link) или четыре (4Link) IF-подключения, получив 160 или 128 свободных линий PCIe 5.0 соответственно. В-третьих, каждый root-комплекс x16 может быть поделён между девятью устройствами (вплоть до x8 + восемь x1). Часть линий можно отдать на SATA (до 32 шт.), хотя это довольно расточительно. Но главное не это! Из 128 линий 64 поддерживают в полном объёме CXL 1.1 и частично CXL 2.0 Type 3, причём возможна бифуркация вплоть до x4. Ради такой поддержки CXL выход Genoa задержался на два квартала, но оно того определённо стоило — к процессору можно подключать RAM-экспандеры. И решения SK Hynix уже валидированы для новой платформы. CXL-память будет выглядеть как NUMA-узел (без CPU) — задержки обещаны примерно те же, что и при обращении к памяти в соседнем сокете, а пропускная способность одного CXL-подключения x16 почти эквивалентна двум каналам DDR5. При этом для CXL-памяти прозрачно поддерживаются всё те же функции безопасности, включая SME/SEV/SNP (теперь ключей стало аж 1006, а алгоритм обновлён до 256-бит AES-XTS). Отдельно для CXL-памяти внедрена поддержка SMKE (secure multi-key encryption), с помощью которой гипервизор может оставлять зашифрованными выбранные области SCM-устройств (до 64 ключей) между перезагрузками. Такая гибкость при работе с памятью крайне важна для тех же гиперскейлеров. DDR5 по сравнению с DDR4 вчетверо плотнее, вполовину быстрее и… пока значительно дороже. И здесь AMD снова пошла им навстречу, добавив поддержку 72-бит памяти, а не только стандартной 80-бит, сохранив и расширив механизмы коррекции ошибок. 10-% разница в количестве DRAM-чипов при сохранении той же ёмкости на масштабах в десятки и сотни тысяч серверов выливается в круглую сумму. Кроме того, в Genoa сглажена разница в производительности между одно- и двухранговыми модулями с 25 % (в случае Milan) до 4,5 %. Что примечательно, AMD удалось сохранить сопоставимый уровень задержки обращений к памяти между поколениями CPU: 118 нс против 108 нс, из которых только 3 нс приходится на IO-блок, а 10 нс уже на саму память. Теоретическая пиковая пропускная способность памяти составляет 460,8 Гбайт/с на сокет. Однако тут есть нюансы. Genoa имеет 12 каналов памяти DDR5-4800, которые способны вместить до 6 Тбайт RAM. Однако сейчас фактически доступен только режим 1DPC, а вот 2DPC, судя по всему, появится только в следующем году. Genoa поддерживает модули (3DS) RDIMM и предлагает чередование с шагом в 2, 4, 6, 8, 10 или 12 каналов. Каждый чип можно разбить на два (NPS2) или четыре (NPS4) равных NUMA-домена, а при большом желании и «прибить» L3-кеш к ядрам в том же CCD, получив уже 12 доменов. Но, по словам AMD, это нужно лишь в редких случаях, чтобы выжать ещё несколько процентов производительности. И это снова возвращает нас к особенностям IO-блока. Дело в том, что у каждого CCD есть сразу два GMI-порта. Но в конфигурациях с 8 и 12 CCD используется только один из них, а вот в случае 4 CCD — оба. Интересно, задействует ли AMD «лишние» порты для подключения других блоков. Впрочем, AMD, имея столь гибкие возможности конфигурации моделей, ограничилась относительно скромным начальным набором CPU, которые включает всего 18 моделей с числом ядер от 16 до 96, из которых четыре имеют индекс P (односокетные, чуть дешевле) и четыре — F (выше частота, больше объём L3-кеша). Модельный ряд условно делится на три группы: повышенная производительность на ядро (F-серия), повышенная плотность ядер и повышенный показатель TCO (с относительно малым количеством ядер). На первый взгляд может показаться, что и цены на новинки заметно выросли, но это не совсем так. Например, у топовых моделей условная стоимость одного ядра (а их стала в полтора раза больше) так и крутится около «магического» значения в $123. Но с учётом возросшей производительности на ценовую политику AMD просто грех жаловаться. Прирост IPC между Zen3 и Zen4 составил 14 %, в том числе благодаря увеличению L2-кеша до 1 Мбайт на ядро (L1 и L3 остались без изменений), но не только. Есть и другие улучшения. Например, обновлённый контроллер прерываний AVIC позволяет практически полностью насытить не только 200G, но 400G NIC. С учётом чуть возросших частот и просто катастрофической разнице в количестве ядер топовый вариант Genoa не только значительно обгоняет Milan, но и в два-три раза быстрее старшего Ice Lake-SP. Дело ещё в и том, что Genoa обзавелись поддержкой AVX-512, в том числе инструкций VNNI (DL Boost), которыми так долго хвасталась Intel, а также BF16. Но реализация сделана иначе. У Intel используются «полноценные» 512-бит блоки, дорогие с точки зрения энергопотребления и затрат кремния. AMD же пошла по старому пути, используя 256-бит операции и несколько циклов, что позволяет не так агрессивно сбрасывать частоты. Переход на новый техпроцесс, а также обновлённые подсистемы мониторинга и управления питанием позволили сохранить TDP в разумных пределах от 200 Вт до 360 Вт (cTDP до 400 Вт), что всё ещё позволяет обойтись воздушным охлаждением — всего + 80 Вт для старших процессоров при полуторакратном росте числа ядер. Таким образом, AMD имеет полное право заявлять, что Genoa лидирует по производительности, плотности размещения вычислительных мощностей, энергоэффективности и, в целом, по уровню TCO. У Intel же пока преимущество в более высокой доступности продукции в сложившейся геополитической обстановке. Отдельный вопрос, как AMD будет распределять имеющиеся мощности по выпуску Genoa между гиперскейлерами, корпоративным сектором и HPC-сегментом. Впрочем, компания в любом случае меняет рынок, иногда неожиданным образом. В частности, VMware, которая когда-то из-за EPYC изменила политику лицензирования, была вынуждена дополнительно оптимизировать свои продукты для Genoa. В конце концов, где вы раньше видели 2S-платформу со 192 ядрами и 384 потоками?
10.06.2022 [03:30], Игорь Осколков
AMD анонсировала серверные процессоры EPYC Genoa-X, Siena и TurinНа прошедшем этим вечером отчётном мероприятии Financial Analysts Day 2022 компания AMD поделилась планами по дальнейшему развитию серверных процессоров EPYC. Речь шла как об уже анонсированных продуктах, так и о совершенно новых, предназначенных для неосвоенных ранее компанией сегментов. Наиболее значимым, хотя и наименее детальным, стал официальный анонс пятого поколения AMD EPYC под кодовым именем Turin (EPYC 7005), которое должно появиться до конца 2024 года. Они будут основаны на существенно переработанной архитектуре Zen 5 и изготавливаться по смешанному 3- и 4-нм техпроцессу. Обещано три разновидности кристаллов: обычные, с 3D V-Cache и «облачные» (Zen 5c), оптимизированные для повышения плотности размещения. Важно тут то, что таким образом сохранится преемственность между поколениями, что определённо порадует заказчиков. Но в ближайшее время нас ждёт выход AMD EPYC Genoa, который должен состояться в IV квартале текущего года. Эти 5-нм процессоры получат до 96 ядер Zen 4, 12 каналов DDR5, поддержку PCIe 5.0 и CXL. Причём сейчас уже явно говорится о возможности расширения системной памяти с помощью CXL. Переход на новый техпроцесс и увеличившееся в 1,5 раза количество ядер дали прирост производительности до +75% (в пример приводится тест Java SPECjbb). Для Genoa потребуется новый сокет SP5 (LGA6096). Он же будет готов принять ещё два варианта процессоров. Первый — это новенький Genoa-X, по названию которого легко догадаться, что это тот же Genoa (тоже до 96 ядер), снабжённый расширенным L3-кешем 3D V-Cache (от 1 Гбайт и более). Как и Milan-X, он будет ориентирован на специфический класс нагрузок, которые выигрывают от увеличения доступного объёма кеша. Это, например, расчётные задачи и СУБД. Genoa-X появятся в 2023 году. Тогда же стоит ждать и особую серию Bergamo. Эти процессоры, как и было обещано ранее, получат до 128 ядер (и 256 потоков), сохранив совместимость с сокетом SP5. Основаны они будут на 5-нм ядрах Zen 4c, который чем-то напоминают E-ядра в исполнении Intel. Однако набор команд у Zen 4c будет одинаков с Zen 4. Деталей устройства c-ядер AMD снова не раскрыла, но можно предположить, что у них переработана иерархия кешей. Предназначены они для гиперскейлеров, которым важна плотность размещения ресурсов, а не только производительность В 2023 году появятся и «малые» EPYC’и под кодовым названием Siena. Они оптимизированы с точки зрения энергоэффективности и предлагают до 64 ядер Zen 4. Siena ориентированы на периферийные вычисления и телеком-сегмент. Подробностей о них пока тоже мало. Не исключено, что мы увидим и гибриды наподобие Ice Lake-D, включающие интегрированные «умные» сетевые контроллеры. Существенным для всех новинок станет использование архитектуры Zen 4 (4 и 5 нм), которая, помимо ожидаемого прироста производительности, получит новые возможности. Среди них — поддержка AVX-512 (возможно, не самого полного набора) и новых инструкций для ИИ-нагрузок, которыми Intel хвасталась в течение нескольких лет. Но что ещё более важно, Zen 4 получат четвёртое поколение интерконнекта Infinity Architecture, который позволит более плотно связать различные чиплеты, причём и на уровне «кремния» (2.5D- и 3D-упаковка). А это открывает путь к эффективной компоновке различных функциональных модулей с поддержкой когерентности на уровне всего чипа — AMD подтвердила возможность интеграции FPGA Xilinx и IP-блоков сторонних компаний. Новый интерконнект также совместим с CXL 2.0, что важно для работы с памятью, а будущие версии получат поддержку CXL 3.0 и UCIE. Именно четвёртое поколение Infinity позволило AMD создать свои первые серверные APU Instinct MI300.
30.05.2022 [10:00], Игорь Осколков
Июньский TOP500: есть экзафлопс!59-я редакция TOP500, публичного рейтинга самых производительных суперкомпьютеров мира, стала наиболее знаменательной за последние 14 лет, поскольку официально был преодолён экзафлопсный барьер. Путь от петафлопса оказался долгим — первой петафлопсной системой стал суперкомпьютер IBM Roadrunner, и произошло это аж в 2008 году. Но минимальным порогом для попадания в TOP500 эта отметка стала только в 2019 году. Как и было обещано, официально и публично отметку в 1 Эфлопс в бенчмарке HPL на FP64-вычислениях первым преодолел суперкомпьютер Frontier — его устоявшаяся производительность составила 1,102 Эфлопс при теоретическом пике в 1,686 Эфлопс. Система на платформе HPE Cray EX235a использует оптимизированные 64-ядерные процессоры AMD EPYC Milan (2 ГГц), ускорители AMD Instinct MI250X и фирменный интерконнект Slingshot 11-го поколения. Система имеет суммарно 8 730 112 ядер, потребляет 21,1 МВт и выдаёт 52,23 Гфлопс/Вт, что делает её второй по энергоэффективности в мире. Впрочем, первое место в Green500 по данному показателю всё равно занимает тестовый кластер в составе всё того же Frontier: 120 832 ядра, 19,2 Пфлопс, 309 кВт, 62,68 Гфлопс/Вт. Третье и четвёртое места достались европейским машинам LUMI и Adastra, новичкам TOP500, которые по «железу» идентичны Frontier, но значительно меньше. Да и разница в Гфлопс/Вт между ними минимальна. Скопом они сместили предыдущего лидера — экзотичную японскую систему MN-3 от Preferred Networks. Японская система Fugaku, лидер по производительности в течение двух последних лет, сместилась на второе место TOP500. Третье место у финской системы LUMI с показателем производительности 151,9 Пфлопс — обратите внимание, насколько велик разрыв в первой тройке машин. Наконец, в Топ-10 последнее место занял новичок Adastra (46,1 Пфлопс), который расположен во Франции. В бенчмарке HPCG всё ещё лидирует Fugaku (16 Пфлопс), но, судя по всему, только потому, что для Frontier данных пока нет. Ну и потому, что результат суперкомпьютера LUMI, который почти на порядок медленнее Frontier, в HPCG составляет 1,94 Пфлопс. Наконец, в HPL-AI Frontier также отобрал первенство у Fugaku — 6,86 Эфлопс в вычислениях смешанной точности против 2 Эфлопс. В общем, у Frontier полная победа по всем фронтам, и эту машину можно назвать не только самой быстрой в мире, но первой по-настоящему экзафлопсной системой. Если, конечно, не учитывать неофициальные результаты OceanLight и Tianhe-3 из Поднебесной, которые в TOP500 никто не заявил. Число китайских систем в нынешнем рейтинге осталось прежним (173 шт.), тогда как США «ужались» со 150 до 127 шт. Российских систем в списке всё так же семь. Лидерами по числу поставленных систем остаются Lenovo, HPE и Inspur, а по их суммарной производительности — HPE, Fujitsu и Lenovo. С другой стороны, массовых изменений и не было — в нынешнем списке всего около сорока новых систем. Однако нельзя не отметить явный прогресс AMD — да, чуть больше трёх четвертей машин из списка используют процессоры Intel, но AMD удалось за полгода отъесть около 4 %. При этом AMD EPYC Milan присутствует в более чем трёх десятках систем, а доля Intel Xeon Ice Lake-SP вдвое меньше, хотя эти процессоры появились практически одновременно. Ускорители ожидаемо стали использовать больше — они применяются в 170 системах (было 150). Подавляющее большинство приходится на решения NVIDIA разных поколений, но и для новых Instinct MI250X нашлось место в восьми машинах. Ну а в области интерконнекта Infiniband потихоньку догоняет Ethernet: 226 машин против 196 + ещё 40 с Omni-Path + редкие проприетарные решения. |
|