Материалы по тегу: cpu

31.07.2023 [16:12], Алексей Степин

AVX-512 вдвое ускоряет AMD EPYC Bergamo, а Genoa-X выигрывают от большого кеша

Хотя реализация AVX-512 в процессорах AMD на базе микроархитектуры Zen 4 сомнительна — настоящих 512-битных регистров у этих процессоров нет и для этого в два этапа задействуются имеющиеся 256-битные, сама ситуация на рынке делает эти решения уникальными.

Популярный ресурс Phoronix опубликовал новые тесты, в которых рассматривается выгода от включения поддержки AVX-512 в системах на базе AMD Bergamo. Также внимательно рассмотрен вопрос влияния на производительность большого кеша 3D V-Cache у новых EPYC Genoa-X.

 Поддержка AVX-512 может оказаться очень полезной процессору AMD EPYC. Источник здесь и далее: Phoronix

Поддержка AVX-512 может оказаться очень полезной процессору AMD EPYC. Источник здесь и далее: Phoronix

Несмотря на то, что AVX-512 является детищем Intel, ситуация складывается довольно абсурдная: текущая серия Sapphire Rapids сильно отстаёт по количеству ядер от AMD Bergamo, а многоядерные (до 144 ядер) Xeon серии Sierra Forest, скорее всего, поддержки AVX-512/AVX10 не получат.

Таким образом, AMD Bergamo с ядрами Zen 4c являются единственными в мире 128-ядерными процессорами с поддержкой 512-битных расширений. На примере AMD EPYC 9754 видно, что несмотря на отсутствие полноценных регистров такой ширины, выгода от активации AVX-512 может быть весьма существенной, в некоторых случаях практически двукратной, а в TensorFlow — даже шести- или десятикратной.

По сводному результату видно, что активация AVX-512 даёт Bergamo двукратный прирост производительности, хотя, разумеется, в конечном итоге всё зависит от конкретной нагрузки. Что интересно, задействование 512-битных расширений практически не влияет на частотные характеристики процессора — в среднем, этот показатель оставался равен все тем же 2,9 ГГц, что и без AVX-512.

А вот энергопотребление и тепловыделение в таком режиме заметно возрастают, однако не настолько, чтобы вызвать какие-либо проблемы с перегревом или активацию режима троттлинга, как в некоторых ранних моделях Intel Xeon с поддержкой AVX-512.

А теперь перейдём к EPYC 9684X (Genoa-X) — также достаточно уникальному процессору, сочетающему в себе 96 ядер, AVX-512 и 3D V-Cache, доводящий общий объём кеша L3 до гигантского значения 1,1 Гбайт. В данном случае разница также сильно варьируется в зависимости от характера нагрузки, но в некоторых случаях может быть и двукратной.

В среднем эффект выражается в 12 % приросте производительности, что также весьма неплохо. На тактовую частоту и уровень энергопотребления отключение 3D V-Cache влияния не оказывает. Таким образом становится очевидно, что AMD EPYC 9684X — процессор специфический, уступающий по количеству ядер Bergamo и заточенный исключительно под нагрузки, могущие эффективно использовать огромный объём кеша, такие, как OpenFOAM или OpenVINO.

Постоянный URL: http://servernews.kz/1090769
25.07.2023 [17:12], Руслан Авдеев

RISC-V International стандартизирует серверные чипы на архитектуре RISC-V

RISC-V International, включающая более 1000 компаний из разных стран мира и ставшая ключевым игроком в сфере разработки чипов на архитектуре RISC-V, готовит новый проект. Как сообщает HPC Wire, организация готовится сформировать спецификации для серверных чипов и систем. В частности, речь идёт об утверждении стандартных аппаратных и программных интерфейсов.

Ожидается, что появление таких стандартов позволит применять серверы с решениями на основе RISC-V в облачных средах, где ПО часто виртуализировано. Пока разработка спецификаций касается преимущественно дополнительных компонентов вроде системных контроллеров, уровней виртуализации, систем загрузки, безопасности и т.п. Также спецификация определяет набор возможностей, доступных системному ПО вроде операционных систем и гипервизоров. Кроме того, в новых спецификациях будет прописана поддержка серверными решениями на такой архитектуре технологий вроде CXL.

 Источник изображения: RISC-V International

Источник изображения: RISC-V International

Многие компании уже разрабатывают серверные RISC-V чипы, например, Ventana и Esperanto. Они создают собственные решения, дополняя базовую архитектуру, но они также выразили готовность следовать новым стандартам RISC-V International. Впрочем, пока RISC-V всё ещё не рассматривается как равноценная альтернатива давно применяемым в серверных решениях вариантам x86 или Arm. Ставку на её развитие делают многие компании, включая AMD, Apple, Intel, NVIDIA и Qualcomm, а также российские и китайские компании, страдающие от санкционного давления.

Постоянный URL: http://servernews.kz/1090493
24.07.2023 [15:28], Сергей Карасёв

Лиза Су: доля AMD на рынке серверных процессоров превысила 25 %

Генеральный директор AMD Лиза Су (Lisa Su) рассказала об успехах компании на рынке процессоров для серверов. По её словам, позиции AMD продолжают укрепляться, а доля превысила 25 % в общемировом объёме отгрузок серверных чипов, передаёт DigiTimes. Заявленные Результаты превзошли ожидания аналитиков DigiTimes Research, которые прогнозировали, что доля компании по итогам 2023 года превысит 20 %, а доля Arm-изделий в серверном сегменте окажется на уровне 8 %.

По оценкам Mercury Research, рыночная доля AMD в сегменте процессоров для серверов выросла с 10,7 % в начале 2022-го до 17,6 % в конце прошлого года, тогда как доля Intel упала с 89,3 % до 82,4 %. Общая доля AMD на мировом CPU-рынке (за исключением изделий IoT и кастомизированных решений) поднялась с 23,3 % в 2021 году до 29,6 % в 2022-м, в то время как доля Intel сократилась с 76,7 % до 70,4 %.

 Источник изображения: AMD

Источник изображения: AMD

AMD готовится вывести на рынок гибридное решение Instinct MI300 — самый крупный и сложный чип компании. «MI300 — самый сложный продукт в мире, мы не смогли бы сделать его без партнёрства с TSMC», — отметила госпожа Су, тем самым опровергнув слухи о том, что AMD может перенести производство ИИ-чипов исключительно на мощности Samsung Electronics.

Постоянный URL: http://servernews.kz/1090450
19.07.2023 [22:03], Илья Коваль

Ядер много не бывает: первые тесты AMD EPYC Genoa-X и Bergamo показали почти безоговорочную победу над Intel Xeon Sapphire Rapids и Xeon Max

В Сети появились первые тесты процессоров AMD EPYC Genoa-X и Bergamo, которые были представлены в конце мая. Первый из них является вариантом Genoa с 3D V-Cache объёмом 768 Мбайт в максимальной конфигурации с 96 ядрами, что в сумме даёт 1152 Мбайт L3-кеша на процессор. Второй же предлагает до 128 ядер Zen4c с пониженной частотой и урезанным кешем и оптимизирован для нужд гиперскейлеров.

Так, согласно тестам Phoronix, в HPC- и ИИ-бенчмарках, на которые Genoa-X и ориентирован, 9684X в стандартном режиме в среднем обгоняет и обычные Genoa 9654 с «открученными» лимитами (cTDP 400 Вт), и Milan-X (7773X), и Xeon Sapphire Rapids (8490H), и Xeon Max (9480). Отдельно отмечается прирост производительности в сравнении с Milan-X, при этом разница между чипами составляет менее двух лет.

 Источник: Phoronix

Источник: Phoronix

Что касается Intel Xeon Max, которые благодаря набортной памяти HBM2e объёмом 64 Гбайт как раз должны составлять конкуренцию Genoa-X в «тяжёлых» задачах, из-за значительного меньшего количества ядер тягаться с EPYC могут далеко не всегда и показывают хорошие результаты в режиме HBM-only (без системной DDR5). Но это касается только задач, которым хватает набортной памяти, и отдельных (пока редких) нагрузок, которые заранее оптимизированы для актуальной платформы Intel и, например, умеют задействовать инструкции AMX для ИИ-вычислений.

 Источник: Phoronix

Источник: Phoronix

В этих же тестах был ещё один участник — EPYC 9754 (Bergamo). В нетипичных для него нагрузках он всё равно показал достойный результат, всё же 128 ядер — это 128 ядер. В ещё одном тестировании Phoronix он обогнал всех прочих участников, показав прирост на уровне 20 % в сравнении со старшим Genoa(-X) в нагрузках, которые хорошо распараллеливаются. При этом он оказался энергоэффективнее и своих собратьев с ядрами Zen4, и Intel Xeon.

Так что этот чип действительно будет интересен облачным провайдерам, но не только им. Это отлично решение для рендера и некоторых расчётных нагрузок. Intel сейчас не в состоянии противопоставить что-либо Bergamo, но гораздо интереснее увидеть сравнение новинок с AmpereOne. Пока что ServeTheHome отмечает значительное превосходство Bergamo над процессорами Ampere Altra Max, которые тоже имеют 128 ядер, но Arm и без SMT.

Постоянный URL: http://servernews.kz/1090249
09.07.2023 [00:23], Сергей Карасёв

Intel выпустит чипы Xeon D на базе Granite Rapids в 2025 году

Корпорация Intel, по сообщению ресурса Computer Base, организует поставки процессоров Xeon Granite Rapids для серверов в конце 2024 года: речь идёт об изделиях Granite Rapids-AP и Granite Rapids-SP. А несколько позднее выйдут чипы Xeon Granite Rapids-D, предназначенные для применения в периферийном оборудовании, а также в СХД. Выход новинок на коммерческий рынок ожидается в 2025 году.

Решения Xeon Granite Rapids-D в исполнении BGA4368 придут на смену Xeon D-1700 и D-2700 семейства Ice Lake-D, которые дебютировали в феврале 2022 года. Для чипов нового поколения предусмотрено использование техпроцесса Intel 3. Обнародованные сведения говорит о том, что готовящиеся процессоры предложат повышенную плотность компоновки, а также инновации в области I/O. В частности, ожидается не только поддержка PCIe 5.0, но и CXL 2.0.

 Источник: Twitter@yuuki_ans

Источник: Twitter@yuuki_ans

Согласно утечке, в этом поколении Xeon D снова будут два семейства процессоров: HCC и XCC. Отличаться они будут не только числом ядер, но и количеством I/O-блоков и каналов памяти: один или два блока и четыре или восемь каналов соответственно. Обязательный в обоих вариантах I/O-блок предложит HSIO, Ethernet и акселераторы (видимо, речь о QAT). Второй I/O-блок в XCC-семействе предлагает только Ethernet и те же акселераторы.

Несколько необычно то, в этих чипах появится поддержка инструкций AMX-COMPLEX для работы с матрицами комплексных чисел половинной точности. Подчёркивается, что для других изделий семейства, таких как Granite Rapids-AP и Granite Rapids-SP, использование AMX-COMPLEX, по всей видимости, не предусмотрено.

Постоянный URL: http://servernews.kz/1089638
08.07.2023 [23:57], Сергей Карасёв

Intel возобновила поставки процессоров Xeon Sapphire Rapids, устранив баг путём обновления прошивки

Компания Intel, по сообщению ресурса Tom's Hardware, возобновила отгрузки процессоров Xeon Sapphire Rapids после устранения выявленной ошибки. Клиенты, которые ранее закупили проблемные чипы, могут получить обновление микрокода, в котором баг отсутствует.

Об обнаруженной ошибке стало известно в конце июня нынешнего года. Говорилось, что баг может провоцировать внезапную остановку работы системы. На тот момент способов решения проблемы известно не было. Чипы Sapphire Rapids доступны в двух конструктивных вариантах: XCC и MCC. В первом случае применяется сборка из четырёх кристаллов: число вычислительных ядер варьируется от 36 до 60. Вторая модификация имеет монолитную конструкцию с числом ядер до 32. И именно в MCC-изделиях обнаружилась недоработка. Intel заявила о приостановке поставок этих процессоров из соображений предосторожности, но не назвала конкретную дату возобновления отгрузок.

 Изображение: Intel

Изображение: Intel

Проблему удалось решить путём выпуска новой версии прошивки, так что компании не пришлось инициировать дорогостоящую программу отзыва и замены чипов. «Недавно мы сообщили о проблеме с подмножеством процессоров Intel Xeon со средним числом ядер (SPR-MCC), которая может прерывать работу системы при определённых условиях. Из соображений предосторожности мы временно приостановили поставки этих изделий. Теперь мы уверены, что новая микропрограмма решает проблему. Мы возобновили поставки всех версий SPR-MCC и работаем с клиентами над внедрением исправленной прошивки», — сказали в Intel.

Постоянный URL: http://servernews.kz/1089641
30.06.2023 [21:39], Владимир Мироненко

Глава Oracle считает, что архитектура Intel x86 теряет актуальность для серверов

В 2023 году Oracle планирует потратить значительные средства на приобретение чипов AMD и Ampere Computing для новой инфраструктуры, отметив, что «старая архитектура Intel x86 достигает своего предела».

«В этом году Oracle купит GPU и CPU у трёх компаний,сообщил на прошедшем в среду мероприятии глава Oracle Ларри Эллисон (Larry Ellison). — Мы будем покупать GPU у NVIDIA, мы покупаем у неё на миллиарды долларов США. И потратим в три раза больше на центральные процессоры от Ampere и AMD. Мы по-прежнему тратим больше денег на традиционные чипы».

Oracle сообщила, что впервые за 14 лет существования специализированных ПАК Exadata для СУБД она полностью отказалась от процессоров Intel в пользу чипов AMD. В платформе 12-го поколения Exadata X10M в рамках двух предложений Oracle Exadata Machine и управляемого решения Oracle Exadata Cloud@Customer будут использоваться AMD EPYC Genoa. Одной из причин такого перехода, пусть и далеко не самой важной, считается отказ Intel от Optane.

 Источник изображения: Oracle

Источник изображения: Oracle

С момента запуска Exadata в 2008 году Oracle полагалась на процессоры Intel Xeon. Но ситуация начала меняться c выходом X9M в 2021 году. Для Oracle Exadata Machine и Oracle Exadata Cloud@Customer компания выбрала чипы Intel Xeon Ice Lake-SP, а в начале 2022 года для облачного решения Oracle Exadata Cloud Infrastructure решила использовать чипы AMD. При этом EPYC Milan использовались в серверах для обеспечения работы баз данных, а Ice Lake-SP — для СХД.

Кроме того, на днях Oracle сделала важный шаг — перенесла свою флагманскую СУБД Oracle Database на архитектуру Arm, т.е. на процессоры компании Ampere Computing, в которую в своё время инвестировала. Эллисон отметил, что чипы Ampere Altra намного энергоэффективнее решений AMD и NVIDIA, что поможет ЦОД Oracle соответствовать будущим регуляциям. «Мы перешли на новую архитектуру и к новому поставщику, — сообщил Эллисон. — Мы думаем, что это будущее. Старая архитектура Intel x86 после многих десятилетий на рынке подошла к своему пределу».

 Источник изображения: Oracle

Источник изображения: Oracle

Тем не менее, эксперты полагают, что ставка Oracle на архитектуру Arm не помешает её отношениям с AMD в ближайшее время, тем более что Intel и AMD планируют бороться с Arm-процессорами с помощью оптимизированных для облачных платформ чипов с высокой плотностью ядер и улучшенной энергоэффективностью: EPYC Bergamo и Xeon Sierra Forest. Кроме того, разработка, перенос и рефакторинг ПО для Arm требует времени и средств.

В свою очередь, представитель Intel сообщил ресурсу CRN в четверг, что компания поставляет Oracle процессоры Xeon Sapphire Rapids «в течение многих месяцев и планирует продолжать поставки Xeon текущего и следующего поколения в будущем». Компании связывают долгие годы совместной работы над аппаратными и программными решениями для клиентов, а сейчас Intel поставляет чипы для облачной инфраструктуры Oracle OCI.

Постоянный URL: http://servernews.kz/1089257
30.06.2023 [10:22], Сергей Карасёв

Самый мощный процессор AMD EPYC Bergamo со 128 ядрами появился в продаже в Европе

Европейские ретейлеры, по сообщению ресурса TechRadar, начали приём заказов на самый мощный в мире процессор с архитектурой x86 — чип AMD EPYC 9754 поколения Bergamo, который был официально представлен только около двух недель назад.

Изделие объединяет 128 вычислительных ядер с возможностью одновременной обработки 256 потоков инструкций. Базовая тактовая частота составляет 2,25 ГГц, максимальная частота в турбо-режиме — 3,1 ГГц. Возможно использование до 6 Тбайт оперативной памяти DDR5. Реализована поддержка PCIe 5.0. Показатель TDP равен 360 Вт.

 Источник изображения: AMD

Источник изображения: AMD

Сообщается, что заказы на процессор EPYC 9754 с кодовым обозначением 100-000001234 начали принимать ретейлеры в Нидерландах, Финляндии, Польше, Швеции, Дании, Бельгии и Франции. Речь идёт об OEM-варианте, рассчитанном на отгрузки в больших партиях. Цена варьируется от $9500 до $11 200 за штуку. Правда, у большинства онлайновых продавцов на момент написания заметки чип значился «отсутствующим на складе».

В интернете также появились результаты тестов, подтверждающие высочайшую производительность EPYC 9754. Так, например, бенчмарк V-Ray 5 говорит о том, что один такой процессор по быстродействию превосходит связку из двух чипов Intel Xeon Platinum 8490H (Sapphire Rapids) с 60 ядрами. А в тесте SPEC CPU 2017 система с двумя процессорами EPYC 9754 опередила четырёхпроцессорный сервер с Xeon Platinum 8490H при меньшем энергопотреблении.

Постоянный URL: http://servernews.kz/1089219
29.06.2023 [18:46], Алексей Степин

Опубликованы результаты тестов Intel Xeon Max: набортная HBM-память даёт заметное преимущество в ИИ- и HPC-нагрузках

Процессоры Intel серии Xeon Max отличаются от своих обычных, «не максимальных» собратьев наличием интегрированной памяти HBM2e объёмом 64 Гбайт. Что же это даёт им на практике? Этот вопрос исследовал ресурс Phoronix — им в руки новейшие двухсокетные системы Supermicro Hyper SuperServer SYS-221H-TNR с чипами Xeon Max 9468 и 9480.

Напомним, Intel Xeon Max отличается от своих обычных собратьев серии Sapphire Rapids наличием 64 Гбайт HBM2e на борту, причём объём одинаков для всех моделей, хотя количество ядер может варьироваться от 32 до 56. Процессоры Xeon Max были протестированы в трёх режимах: только с памятью HBM (без DDR5), с HBM в качестве кеша для 512 Гбайт DDR5, а также в «плоском» режиме, но без отдачи HBM какому-либо процессу, то есть фактически только с DDR5.

 Изображение: Intel

Изображение: Intel

Тесты показали, что два первых режима действительно могут обеспечить преимущество в некоторых сценариях нагрузки. Результаты получились вполне закономерными: там, где сравнительно небольшого объёма HBM2e достаточно, режим HBM Only оказывается самым быстрым из-за высокой пропускной способности и отсутствия необходимости как-то синхронизировать работу с DDR5.

 Источник: Phoronix

Источник: Phoronix

Однако режим кеширования тоже обеспечивает выигрыш, хотя в ряде нагрузок, таких как OpenFOAM, он не такой большой. В ИИ-сценариях, в частности, в тестах OpenVINO, разница меньше, а иногда отключение HBM2e и вовсе позволяет добиться чуть лучшей производительности, особенно на системе с Xeon Max 9480, где на каждое ядро приходится меньше памяти. Но в других тестах, таких как PETSc и Stress-NG, использование HBM2e может дать огромный прирост производительности, который глупо было бы игнорировать.

В целом, можно уверенно заявлять, что в среднем, прирост производительности при HBM-кешировании составляет 10–11 %, а при отказе от DDR5 к этому значению можно добавить ещё около 8 %. Также очевидно, что потребление системы в таком режиме заметно ниже, поскольку не требуется питание для модулей DDR5. В целом можно говорить о 18–20 % превосходства на широком спектре нагрузок, сообщает Phoronix.

Постоянный URL: http://servernews.kz/1089160
28.06.2023 [17:22], Алексей Степин

Появились первые фото Intel Xeon Granite Rapids для огромного сокета LGA 7529

В 2024 году на смену платформам Sapphire Rapids и Emerald Rapids корпорация Intel планирует выпустить чипы Granite Rapids на базе производительных Р-ядер. Эти процессоры будут производиться с использованием техпроцесса Intel 3 и будут поистине огромными в смысле физических размеров — на днях энтузиасту с ником YuuKi_AnS удалось получить первые фотографии Granite Rapids.

Тенденция к укрупнению процессорных разъёмов не нова: эта гонка стартовала аккурат в момент переезда контроллера памяти, а затем и шины PCI Express из чипсета в сам процессор, и постепенно наращивание возможностей обеих интерфейсов сделало своё дело.

Источник изображений здесь и далее: YuuKi_AnS

Но снимки, опубликованные YuuKi_AnS, впечатляют даже на фоне AMD SP5 для платформы Genoa. Неудивительно, новый разъём превосходит SP5 даже по количеству контактов — 7529 против 6096. Процессоры Granite Rapids получат 12 каналов DDR5-5600, 96 линий PCIe 5.0 и поддержку CXL 2.0.

По размерам новые процессоры приблизительно в 1,7 раза больше Sapphire Rapids, ожидается, что размеры LGA-7529 составят 105 × 70 мм, что действительно больше, чем у AMD SP5, где аналогичные размеры составляют 75 × 72 мм; для сравнения, LGA-4189 (Ice Lake-SP) имеет габариты 77,6 × 56,6 мм.

Технически процессоры будут состоять из двух кристаллов с архитектурой Redwood Cove, включающей в себя только Р-ядра. Компания Intel планирует минимум три варианты охлаждения, рассчитанных на 400–500 Вт. Более подробно о Granite Rapids «синие» расскажут на мероприятии Intel Innovation, запланированном на сентябрь этого года.

Постоянный URL: http://servernews.kz/1089103
Система Orphus