Материалы по тегу: genoa

09.12.2023 [23:16], Сергей Карасёв

Supermicro представила ИИ-серверы с ускорителями AMD Instinct MI300 и СЖО

Компания Supermicro анонсировала серверы AS-8125GS-TNMR2, AS-4145GH-TNMR и AS-2145GH-TNMR, предназначенные для задач НРС и ИИ, в том числе для обучения больших языковых моделей (LLM). Новинки выполнены на аппаратной платформе AMD и оборудованы ускорителями серии Instinct MI300.

Модель AS-8125GS-TNMR2 соответствует типоразмеру 8U. Она оснащена двумя процессорами AMD EPYC Genoa с показателем TDP до 400 Вт и восемью ускорителями Instinct MI300X со 192 Гбайт памяти HBM3. Объём оперативной памяти DDR5-4800 RDIMM/LRDIMM может достигать 6 Тбайт (24 слота). Доступны 18 отсеков для SFF-накопителей NVMe/SATA и коннектор M.2 NVMe. Предусмотрены восемь слотов для карт PCIe 5.0 x16 LP и два слота для карт PCIe 5.0 x16 FHFL. Задействована система воздушного охлаждения. Питание обеспечивают шесть или восемь блоков мощностью 3000 Вт с сертификатом 80 Plus Titanium.

 Источник изображений: Supermicro

Источник изображений: Supermicro

Серверы AS-4145GH-TNMR и AS-2145GH-TNMR выполнены в форм-факторе 4U и 2U соответственно. Первый наделён системой воздушного охлаждения, второй — жидкостного. При этом оба получили четыре чипа Instinct MI300A (24 ядра EPYC Genoa, ускоритель CDNA 3 и 128 Гбайт памяти HBM3).

Устройство AS-4145GH-TNMR располагает 24 отсеками для накопителей SFF NVMe/SAS/SATA с возможностью горячей замены и двумя разъёмами для модулей M.2 NVMe или SATA. Есть шесть слотов PCIe 5.0 x16 FHHL и два разъёма PCIe 5.0 x16 AIOM. Задействованы четыре блока питания на 1600 Вт с сертификатом 80 Plus Titanium.

Сервер AS-2145GH-TNMR получил восемь посадочных мест для накопителей SFF NVMe/SAS/SATA и два разъёма для SSD M.2 NVMe или SATA. Доступны четыре слота PCIe 5.0 x16 FHHL и два слота PCIe 5.0 x16 AIOM. За питание отвечают четыре блока на 1600 Вт с сертификатом 80 Plus Titanium.

Постоянный URL: http://servernews.kz/1097223
08.12.2023 [16:31], Сергей Карасёв

Gigabyte представила серверы с ускорителями AMD Instinct MI300 для задач ИИ и HPC

Компания Giga Computing (Gigabyte) анонсировала серверы G383-R80, G593-ZX1 и G593-ZX2 на аппаратной платформе AMD, предназначенные для решения ресурсоёмких задач: это могут быть приложения ИИ и HPC. Все новинки оборудованы ускорителями серии Instinct MI300.

Модель G383-R80, выполненная в формате 3U, несёт на борту четыре чипа Instinct MI300A (24 ядра EPYC Genoa, ускоритель CDNA 3 и 128 Гбайт памяти HBM3). Во фронтальной части расположены 8 отсеков для SFF-накопителей NVMe SSD.

 Источник изображений: Gigabyte

Источник изображений: Gigabyte

Могут быть задействованы до 12 слотов расширения для карт FHFL с интерфейсом PCIe 5.0. Есть слот для SSD стандарта М.2 2280/22110 с интерфейсом PCIe 5.0 x4, два сетевых порта 10GbE (Broadcom BCM57416), выделенный порт управления 1GbE, контроллер Aspeed AST2600, два порта USB 3.2 Gen1 и разъём D-Sub. Питание обеспечивают четыре блока мощностью 2200 Вт каждый с сертификатом 80 Plus Titanium.

Серверы G593-ZX1 и G593-ZX2, в свою очередь, имеют типоразмер 5U. Они комплектуются двумя процессорами AMD EPYC Genoa с показателем TDP до 300 Вт и восемью ускорителями Instinct MI300X OAM со 192 Гбайт памяти HBM3. Для модулей ОЗУ стандарта DDR5-4800 доступны 24 разъёма. Спереди находятся восемь отсеков для SFF-накопителей NVMe SSD.

Эти серверы оборудованы двумя слотами для SSD формата М.2 2280/22110 с интерфейсом PCIe 3.0 (по одному х1 и х4), двумя портами 10GbE (Intel X710-AT2), выделенным сетевым портом управления 1GbE, контроллером Aspeed AST2600, двумя портами USB 3.2 Gen1 и разъёмом D-Sub. Предусмотрены четыре слота PCIe 5.0 x16 для карт FHHL и восемь слотов PCIe 5.0 x16 для LP-карт. Версия G593-ZX1 получила восемь root-портов, модель G593-ZX2 — четыре. Установлены шесть блоков питания на 3000 Вт с сертификатом 80 Plus Titanium.

Постоянный URL: http://servernews.kz/1097167
21.11.2023 [09:56], Сергей Карасёв

MSI представила GPU-серверы с жидкостным охлаждением на AMD EPYC Genoa и Intel Xeon Sapphire Rapids

Компания MSI на конференции по высокопроизводительным вычислениям SC23 представила новые серверы на процессорах AMD EPYC Genoa и Intel Xeon Sapphire Rapids. Устройства ориентированы на дата-центры и подходят для НРС-нагрузок, генеративного ИИ и других ресурсоёмких задач.

Одна из новинок — платформа G4201, которая допускает установку двух чипов Xeon Sapphire Rapids и 32 модулей оперативной памяти DDR5. Этот сервер формата 4U располагает восемью слотами PCIe 5.0 x16 для ускорителей высотой в два слота, а также двумя PCIe 5.0 x16 для карт толщиной в один слот.

Дебютировал также сервер G4101 типоразмера 4U. Он рассчитан на один чип EPYC Genoa (до 128 ядер; TDP до 500 Вт) и 12 модулей DDR5-4800. Возможно применение жидкостного охлаждения. Доступны четыре разъёма PCIe 5.0 х16 для трёхслотовых ускорителей и ещё два разъёма PCIe 5.0 x16. Во фронтальной части расположены отсеки для 12 накопителей U.2 NVMe или SAS/SATA (SFF). Кроме того, предусмотрены два коннектора M.2 M-Key (2280/22110, PCIe 3.0 x4/x2). Питание обеспечивают два блока мощностью 3000 Вт каждый.

 Источник изображений: MSI

Источник изображений: MSI

Ещё одна новинка — модель G3101, получившая исполнение 3U. Она допускает установку одного процессора EPYC 7002/7003 с 64 ядрами (до 300 Вт) и восьми модулей DDR4-3200. Поддерживается развёртывание СЖО. Есть шесть отсеков для SFF-накопителей с интерфейсом SATA-3 и четыре слота PCIe 4.0 x16 для карт FHFL. Предусмотрены два сетевых порта 10GbE на базе Intel X710AT2. В оснащение включены два блока питания на 1600 Вт.

Кроме того, MSI анонсировала два сервера с поддержкой Compute Express Link (CXL) — модели S1301 и S2302, оптимизированные для задач с интенсивным использованием данных. Характеристики версии S1301 формата 1U таковы: два процессора EPYC 9004 (Genoa) с 32 ядрами и TDP до 210 Вт, 24 слота для модулей DDR5-4800, два разъёма PCIe 5.0 x16 для ускорителей HHHL, 10 отсеков для накопителей E3.S CXL, два коннектора M.2 M-Key 2280 (PCIe 3.0 x2) и два блока питания мощностью 1600 Вт.

В свою очередь, сервер S2302 стандарта 2U поддерживает два чипа Xeon Sapphire Rapids (до 60 ядер; 350 Вт), 32 модуля DDR5-4800, три ускорителя PCIe 5.0 x16  FHFL и две карты PCIe 5.0 x16 HHHL. Накопители могут устанавливаться по схеме 8 × E3.S CXL и 2 × E3.S PCIe 5.0 SSD или 10 × E3.S PCIe 5.0 SSD. Применены два блока питания на 1600 Вт.

Постоянный URL: http://servernews.kz/1096279
13.11.2023 [13:40], Сергей Карасёв

IBM представила All-Flash СХД Storage Scale System 6000 с производительностью до 256 Гбайт/с и 13 млн IOPS

Корпорация IBM анонсировала СХД Storage Scale System 6000 в форм-факторе 4U. Новинка оптимизирована для хранения полуструктурированных и неструктурированных данных, таких как видеоматериалы, изображения, текст и показания различного оборудования.

В состав изделия входят два контроллера на процессорах AMD EPYC Genoa 7642 (48 ядер; 96 потоков; 2,3–3,3 ГГц; 225 Вт), которые функционируют в режиме Active/Active. Объём оперативной памяти может составлять 768 или 1536 Гбайт.

Могут быть установлены 24 или 48 SSD (NVMe) вместимостью до 30 Тбайт каждый. В первой половине следующего года станут доступны конфигурации с 24 и 48 модулями IBM FlashCore (FCM) ёмкостью до 114 Тбайт (с учётом компрессии 3:1), которые позволят получить эффективную ёмкость до 5,4 Пбайт. Заявленная производительность достигает 13 млн IOPS, пропускная способность — до 256 Гбайт/с. Говорится о поддержке NVIDIA GPUDirect, Container Native Storage Access (CNSA), CSI, HDFS, NFS v4, SMB, HTTP, S3.

 Источник изображения: IBM

Источник изображения: IBM

Доступны 16 слотов расширения PCIe 5.0. Система может быть оборудована сетевыми адаптерами NVIDIA ConnectX-7: поддерживаются до 16 портов 100 Гбит/с RoCE, InfiniBand 200/400 Гбит/с или их комбинация. В оснащение входят четыре блока питания с возможностью горячей замены. Габариты составляют 175 × 483 × 850 мм. СХД использует платформу Red Hat Enterpise Linux (RHEL) и фирменное ПО IBM Storage Scale for Storage Scale System.

Постоянный URL: http://servernews.kz/1095872
20.10.2023 [16:00], Сергей Карасёв

AMD представила процессоры Ryzen Threadripper Pro 7000 WX для мощных рабочих станций

Компания AMD официально анонсировала процессоры Ryzen Threadripper Pro 7000 WX и Ryzen Threadripper 7000 на архитектуре Zen 4 (Genoa). Первые предназначены для построения мощных рабочих станций, а вторые найдут применение в высокопроизводительных настольных ПК (HEDT).

В семейство Ryzen Threadripper Pro 7000 WX вошли шесть моделей, насчитывающих от 12 до 96 вычислительных ядер с возможностью одновременной обработки от 24 до 192 потоков инструкций. Базовая тактовая частота варьируется от 2,5 до 4,7 ГГц, максимальная частота — от 5,1 до 5,3 ГГц.

Чипы несут на борту от 48 до 384 Мбайт кеш-памяти L3, а суммарный объём кеша варьируется от 76 до 480 Мбайт. Показатель TDP у всех изделий одинаков — 350 Вт. Процессоры рассчитаны на работу с материнскими платами на наборе логики WRX90. Доступны восемь каналов для модулей памяти DDR5-5200, максимальный объём которой может достигать 2 Тбайт. Реализована поддержка 148 линий PCIe, из которых доступны 144, а до 128 из них соответствуют стандарту PCIe 5.0. Говорится о поддержке инструкций AVX-512.

 Источник изображений: AMD

Источник изображений: AMD

Чипы Ryzen Threadripper Pro 7000 WX поддерживают технологии AMD Pro и предлагают функции безопасности и управления корпоративного уровня. Процессоры предназначены для выполнения сложного моделирования, рендеринга и других ресурсоёмких задач. Утверждается, что новые решения обеспечивают двукратное повышение производительности по сравнению с изделиями предыдущего поколения в таких инструментах, как Хаос V-Ray. Рабочие станции на данной платформе предложат Dell Technologies, HP, Lenovo и др.

Флагман нового семейства Ryzen Threadripper Pro 7995WX (96 ядер; 192 потока; 2,5–5,1 ГГц) установил новый мировой рекорд в бенчмарке Cinebench R23, показав результат в 100 291 балл. Более того, при разгоне всех 96 ядер до 4,4 ГГц показатель достиг 148 719 баллов. При этом использовалось охлаждение с жидким азотом, а энергопотребление процессора составило 620 Вт. Предыдущий рекорд в 147 668 баллов принадлежал связке из двух чипов EPYC 9654 Genoa.

Что касается процессоров Ryzen Threadripper 7000, то в эту серию вошли три модели с 24, 32 и 64 ядрами с поддержкой многопоточности. Базовая тактовая частота — от 4,0 до 3,2 ГГц, максимальная частота — от 5,1 до 5,3 ГГц. Чипы комплектуются 128/256 Мбайт кеш-памяти L3, а общий размер кеша — от 152 до 320 Мбайт. Процессоры ориентированы на работу в паре с чипсетом TRX50. Обеспечивается поддержка четырёх каналов DDR5-5200 (до 1 Тбайт), 92 линий PCIe (доступны 88 линий, в том числе до 48 линий PCIe 5.0). Показатель TDP у всех процессоров равен 350 Вт. Цена варьируется от $1499 до $4999.

Постоянный URL: http://servernews.kz/1094741
14.09.2023 [19:06], Владимир Мироненко

Amazon объявила о доступности EC2-инстансов R7iz (Intel) и R7a (AMD) для нагрузок с повышенными требованиями к памяти

Amazon объявила о доступности инстансов EC2 R7iz на базе процессоров Intel Xeon Sapphire Rapids с постоянной турбо-частотой всех ядер 3,9 ГГц и EC2 R7a на базе процессоров AMD EPYC Genoa с максимальной частотой 3,7 ГГц.

 Изображения: Amazon AWS

Изображения: Amazon AWS

Оба семейства предназначены для рабочих нагрузок, требующих больше памяти, вертикального масштабирования, а также более высокую производительность и низкую задержку сети и томов EBS. Экземпляры R7iz ориентированы на EDA, СУБД с высокими лицензионными сборами за ядро, системы анализа данных и финансовые расчёты. К каждому R7iz можно подключить до 88 EBS-томов.

Amazon EC2 R7iz включают фирменные ускорители Intel — инструкции AMX доступны для всех размеров инстансов R7iz, а ускорители Intel QAT, IAA и DSA будут доступны на экземплярах r7iz.metal-16xl и r7iz.metal-32xl. Инстансы R7iz уже доступны в регионах US East (Северная Вирджиния, США) и US West (Орегон, США). Bare metal варианты появятся чуть позже.

Скорость подключения инстансов к сети составляет до 50 Гбит/с, а к EBS-томам — до 40 Гбит/с. Лимиты одинаковы для R7iz и R7a, но к AMD-инстансам можно подключить до 128 EBS-томов. R7a построены на базе системы AWS Nitro, используют адаптеры AWS Elastic Fabric Adapter (EFA), поддерживают инструкции AVX-512 VNNI и формат BF16.

Сообщается, что R7a сертифицированы SAP и идеально подходят для высокопроизводительных рабочих нагрузок с интенсивным использованием памяти, таких как базы данных (No)SQL и in-memory, распределённые кеши, аналитика больших данных в реальном времени и системы EDA. Инстансы Amazon EC2 R7a доступны в следующих регионах AWS: US East (Огайо, США), US East (Северная Вирджиния, США), US West (Орегон, США) и EU (Ireland).

Постоянный URL: http://servernews.kz/1093014
18.08.2023 [11:23], Сергей Карасёв

AWS запустила HPC-инстансы EC2 Hpc7a на базе AMD EPYC Genoa

В январе 2022 года облачная платформа Amazon Web Services (AWS) представила EC2-инстансы Hpc6a на базе процессоров AMD EPYC Milan для обработки HPC-задач. А теперь дебютировало новое поколение этих решений — EC2 Hpc7a с более производительными чипами AMD EPYC Genoa. Hpc7a уже доступны в трёх регионах: US East (Огайо), EU (Ирландия) и US GovCloud.

Утверждается, что по сравнению с EC2 Hpc6a инстансы нового поколения обеспечивают повышение быстродействия до 2,5 раза. Говорится об использовании сетевого подключения на базе Elastic Fabric Adapter (EFA) со скоростью передачи данных 300 Гбит/с. Инстансы EC2 Hpc7a выполнены на основе AWS Nitro.

 Источник изображения: AWS

Источник изображения: AWS

Используется оперативная память DDR5 объёмом 768 Гбайт. Заказчики могут выбирать из четырёх основных конфигураций — с 24, 48, 96 и 192 вычислительными ядрами EPYC Genoa. Для хранения данных доступны только тома Elastic Block Store (EBS).

 Источник: AWS

Источник: AWS

Отмечается, что инстансы EC2 Hpc7a отлично подходят для выполнения таких задач, как вычислительная гидродинамика и численные прогнозы погоды. Дополнительно можно использовать инструмент ParallelCluster с открытым исходным кодом, который упрощает развертывание кластеров HPC и управление ими. Вместе с тем средства AWS Batch помогают эффективно выполнять сотни тысяч пакетных задач в области вычислений и машинного обучения, при этом оптимизируя использование ресурсов.

Постоянный URL: http://servernews.kz/1091672
17.08.2023 [12:13], Сергей Карасёв

В AWS стали доступны инстансы EC2 M7a общего назначения на базе AMD EPYC Genoa

В ноябре 2021 года облачная площадка Amazon Web Services (AWS) запустила инстансы EC2 M6a с процессорами AMD EPYC Milan, работающими на частоте до 3,6 ГГц. А теперь объявлено о доступности инстансов общего назначения EC2 M7a с чипами AMD EPYC Genoa.

Новые инстансы используют процессоры с частотой до 3,7 ГГц. Утверждается, что по сравнению с EC2 M6a общая производительность увеличилась приблизительно на 50 %. Это даёт возможность «быстрее обрабатывать данные, консолидировать рабочие нагрузки и снизить стоимость владения».

 Источник изображения: AWS

Источник изображения: AWS

Заказчикам доступны от 1 до 192 vCPU, а объём оперативной памяти DDR5 составляет 4 Гбайт в расчёте на vCPU. Заявленная пропускная способность сетевого подключения варьируется от 12,5 Гбит/с до 50 Гбит/с, пропускная способность EBS — от 10 до 40 Гбит/с. Инстансы построены на базе AWS Nitro.

Говорится о сертификации SAP. По заявлениям AWS, инстансы EC2 M7a отлично подходят для таких задач, как финансовые приложения, имитационное моделирование, игры, серверы приложений, хранилища данных среднего размера, среды разработки приложений и пр. Инстансы уже доступны в регионах US East (Огайо), US East (Северная Вирджиния), US West (Орегон) и EU (Ирландия).

Постоянный URL: http://servernews.kz/1091607
31.07.2023 [16:12], Алексей Степин

AVX-512 вдвое ускоряет AMD EPYC Bergamo, а Genoa-X выигрывают от большого кеша

Хотя реализация AVX-512 в процессорах AMD на базе микроархитектуры Zen 4 сомнительна — настоящих 512-битных регистров у этих процессоров нет и для этого в два этапа задействуются имеющиеся 256-битные, сама ситуация на рынке делает эти решения уникальными.

Популярный ресурс Phoronix опубликовал новые тесты, в которых рассматривается выгода от включения поддержки AVX-512 в системах на базе AMD Bergamo. Также внимательно рассмотрен вопрос влияния на производительность большого кеша 3D V-Cache у новых EPYC Genoa-X.

 Поддержка AVX-512 может оказаться очень полезной процессору AMD EPYC. Источник здесь и далее: Phoronix

Поддержка AVX-512 может оказаться очень полезной процессору AMD EPYC. Источник здесь и далее: Phoronix

Несмотря на то, что AVX-512 является детищем Intel, ситуация складывается довольно абсурдная: текущая серия Sapphire Rapids сильно отстаёт по количеству ядер от AMD Bergamo, а многоядерные (до 144 ядер) Xeon серии Sierra Forest, скорее всего, поддержки AVX-512/AVX10 не получат.

Таким образом, AMD Bergamo с ядрами Zen 4c являются единственными в мире 128-ядерными процессорами с поддержкой 512-битных расширений. На примере AMD EPYC 9754 видно, что несмотря на отсутствие полноценных регистров такой ширины, выгода от активации AVX-512 может быть весьма существенной, в некоторых случаях практически двукратной, а в TensorFlow — даже шести- или десятикратной.

По сводному результату видно, что активация AVX-512 даёт Bergamo двукратный прирост производительности, хотя, разумеется, в конечном итоге всё зависит от конкретной нагрузки. Что интересно, задействование 512-битных расширений практически не влияет на частотные характеристики процессора — в среднем, этот показатель оставался равен все тем же 2,9 ГГц, что и без AVX-512.

А вот энергопотребление и тепловыделение в таком режиме заметно возрастают, однако не настолько, чтобы вызвать какие-либо проблемы с перегревом или активацию режима троттлинга, как в некоторых ранних моделях Intel Xeon с поддержкой AVX-512.

А теперь перейдём к EPYC 9684X (Genoa-X) — также достаточно уникальному процессору, сочетающему в себе 96 ядер, AVX-512 и 3D V-Cache, доводящий общий объём кеша L3 до гигантского значения 1,1 Гбайт. В данном случае разница также сильно варьируется в зависимости от характера нагрузки, но в некоторых случаях может быть и двукратной.

В среднем эффект выражается в 12 % приросте производительности, что также весьма неплохо. На тактовую частоту и уровень энергопотребления отключение 3D V-Cache влияния не оказывает. Таким образом становится очевидно, что AMD EPYC 9684X — процессор специфический, уступающий по количеству ядер Bergamo и заточенный исключительно под нагрузки, могущие эффективно использовать огромный объём кеша, такие, как OpenFOAM или OpenVINO.

Постоянный URL: http://servernews.kz/1090769
23.07.2023 [14:57], Сергей Карасёв

ВМС США обзаведутся 17,7-Пфлопс суперкомпьютером Blueback с ускорителями AMD Instinct MI300A

Министерство обороны США (DoD) объявило о планах по развёртыванию новой суперкомпьютерной системы в рамках Программы модернизации высокопроизводительных вычислений (HPCMP). Комплекс получил название Blueback — в честь американской подводной лодки USS Blueback (SS-581).

Сообщается, что Blueback расположится в Центре суперкомпьютерных ресурсов в составе DoD (Navy DSRC), который находится в ведении Командования морской метеорологии и океанографии (CNMOC). Суперкомпьютер заменит три старых вычислительных комплекса в экосистеме HPCMP.

Основой Blueback послужит платформа HPE Cray EX4000. Архитектура включает процессоры AMD EPYC Genoa, 128 гибридных ускорителей AMD Instinct MI300A (APU) и 24 ускорителя NVIDIA L40, связанных между собой 200G-интерконнектом Cray Slingshot-11. В состав комплекса войдёт Lustre-хранилище Cray ClusterStor E1000 вместимостью 20 Пбайт, включая 2 Пбайт пространства на базе SSD NVMe. Объём системной памяти — 538 Тбайт. Общее количество вычислительных ядер будет достигать 256 512.

 Источник изображения: Jonathan Holloway / DoD

Источник изображения: Jonathan Holloway / DoD

Ожидается, что суперкомпьютер Blueback будет введён в эксплуатацию в 2024 году. Кстати, совсем недавно центр Navy DSRC получил НРС-систему Nautilus производительностью 8,2 Пфлопс. Она содержит 176 128 ядер и 382 Тбайт памяти.

Постоянный URL: http://servernews.kz/1090412
Система Orphus