Материалы по тегу: cpu
24.06.2023 [00:07], Владимир Мироненко
YADRO отказалась от архитектуры IBM POWER в пользу открытой RISC-VГазете «Коммерсантъ» стало известно о выходе российского производителя серверов YADRO из консорциума OpenPOWER Foundation (OPF), созданного IBM, Google, NVIDIA, Mellanox Technologies и Tyan, в котором он имел статус «платинового участника» с эксклюзивным доступом к разработкам процессорной архитектуры POWER компании IBM. Сейчас в консорциум входят несколько сотен членов. В YADRO пояснили «Коммерсанту», что решение было принято«в связи с очевидными организационными сложностями в поддержании высокого темпа дальнейшей совместной работы и с учётом стратегического долгосрочного выбора в пользу архитектуры RISC-V». Сейчас открытая процессорная архитектура RISC-V обычно используется для создания решений с низкой производительностью, хотя, помимо целого ряда ИИ-ускорителей, есть прототипы достатчно современных серверных CPU, например, от Ventana или SOPHGO. Будучи участником OPF, YADRO имела доступ к предоставляемой IBM совместной разработке архитектуры POWER, на базе которой выпускала серверы Vesnin и СХД Tatlin. Решения YADRO используются в том числе операторами для «закона Яровой», а также госструктурами. По итогам IV квартала 2021 года, согласно данным IDC, лидерами российского рынка СХД в денежном выражении стали Huawei, YADRO и Dell с долями 39,1 %, 20,9 % и 9,5 % соответственно, но по объёму поставленных ёмкостей лидировала YADRO, опередившая Huawei и Dell. В целом, компания в 2021 году показала хороший рост, да и прошлый год, судя по всему, был удачным. Эксперты отмечают, что после введения санкций дальнейшая разработка POWER-решений могла стать затруднительной. Вместе с тем в портфолио YADRO уже есть отечественный разработчик RISC-V решений — компания Syntacore, которая не так давно вошла в состав правления RISC-V International. Также YADRO в 2023 году открыла открыл центр разработки в Беларуси, который, как ожидается, также займётся развитием решений RISC-V. Ещё одним российским разработчиком того же профиля является Cloudbear, долю в котором два года назад получил владелец «Байкал электроникс». Примечательно, что и создание OpenPOWER Foundation, и дальнейшее открытие POWER ISA связывают с желанием IBM обойти антикитайские санкции ради продолжения сотрудничества с Inspur, третьим по величине прозводителем серверов в мире, на которого в конечном итоге США неоднократно всё же накладывали ограничения. Впоследствии столь тесная дружба между IBM и Inspur даже привела к судебному разбирательству внутри Китая. Любопытно, что когда-то в состав OpenPOWER Foundation входила ещё одна российская компания, «Рикор».
14.06.2023 [01:30], Игорь Осколков
AMD представила 128-ядерные EPYC Bergamo, а также EPYC Genoa-X с 1152 Мбайт L3-кешаAMD официально представила два новых, пока что очень небольших семейства серверных процессоров EPYC на базе архитектуры Zen 4. Это давно обещанные CPU серии EPYC 97x4, известные под кодовым именем Bergamo и рассчитанные на гиперскейлеров и облачных провайдеров, а также EPYC 9x84X Genoa-X с 3D V-Cache, которые предлагают до 1152 Мбайт L3-кеша и которые ориентированы на HPC-нагрузки. Ничего нового относительно архитектурных особенностей Bergamo компания не поведала. Более высокая плотность компоновки ядер Zen 4c достигнута, в частности, путём модификации кешей (они проще и меньше) и компромиссными решениями в отношении упаковки, частот и т.д. В итоге получается интересная картина — ядер в сравнении с EPYC Genoa (до 96 шт.) стало больше, а вот общее число транзисторов уменьшилось с 90 до 82 млрд. Показатель TDP сохранился на прежнем уровне. AMD говорит, что ядра Zen 4c примерно на треть меньше Zen 4: 2,48 мм2 против 3,84 мм2 (ядро + L2-кеш). Оба варианта производятся по 5-нм техпроцессу TSMC. В CCD теперь содержится 16 ядер вместо 8, а в самом процессоре теперь 8 CCD вместо 12. Центральный IO-мостик у Genoa и Bergamo предлагает одни и те же возможности: 128 линий PCIe 5.0 (CXL) и 12 каналов памяти DDR5-4800. При этом оба варианта совместимы не только на уровне сокета (SP5), но и ISA, и платформы целиком — достаточно обновления BIOS. В случае Bergamo компания, как и прежде, напирает на относительно низкую совокупную стоимость владения и на ещё более высокую энергоэффективность в сравнении с Genoa. Поскольку SMT на месте, в 2U4N-шасси с двухсокетными узлами теперь можно получить 2048 vCPU. Отдельный вопрос, как это всё ещё сбалансировать с точки зрения IO. Но в любом случае такое решение должно привлечь гиперскейлеров, среди которых была упомянута Meta✴, уже использующая сотни тысяч процессоров EPYC. Любопытно, что в пресс-релизе AMD сравнивает общую производительность Bergamo с Ampere Altra, утверждая, что в ключевых облачных нагрузках они в 3,7 раз быстрее. Кроме того, новинки в 2,7 раз энергоэффективнее конкурентов. При этом оба документа, описывающих условия тестирования, на момент написания публикации доступны не были. Возможно, как и в других тестах, речь идёт о 128-ядерных Altra Max, которые уже доступны у ключевых облачных провайдеров. По-видимому, в этой области AMD воспринимает как важного (если не ключевого) конкурента именно Ampere, а не Intel, с продукцией которой были показаны сравнения во время презентации. Так, старший AMD EPYC 9754 до 2,6 раз быстрее старшего же Intel Xeon 8490H (Sapphire Rapids), который предлагает всего 60 ядер при сравнимом TDP. До выхода Sierra Forest с E-ядрами (до 144 шт.) в следующем году Intel отвечать AMD нечем. А вот Ampere уже представила 192-ядерные (но без SMT) AmpereOne, которые, по слухам, уже давно поставляются избранным клиентам. Да и сама AMD заявляет, что Bergamo тоже уже отгружаются. Заодно AMD объявила о доступности EPYC Genoa-X (9x84X). Концептуально они повторяют Milan-X, то есть поверх каждого CCD в обычном Genoa располагается плитка V-Cache с 64 Мбайт L3-кеша (с небольшим штрафом при обращении). 12 CCD дают 768 Мбайт дополнительного кеша, а суммарно выходят умопомрачительные 1152 Мбайт L3-кеша на процессор. Выгоду от столь большого объёма кешей могут получить не все приложения. Речь в основном идёт об HPC, CFD, EDA и СУБД. При этом, что удивительно, AMD сравнивает новинки с «обычными» Intel Xeon Sapphire Rapids, а не с Intel Xeon Max, оснащённых 64 Гбайт набортной HBM2e-памяти (1,2 Тбайт/с) и ориентированных, в целом, на те же задачи — в таком случае они оказываются до 2,9 раз быстрее.
11.06.2023 [14:54], Сергей Карасёв
Intel представила чипы Atom C1100 Arizona Beach для телеком-оборудованияКорпорация Intel, как сообщает ServeTheHome, выпустила процессоры Atom поколения Arizona Beach, предназначенные для применения в сетевых устройствах, телекоммуникационном оборудовании, встраиваемых системах и решениях для Интернета вещей (IoT). Изделия производятся по технологии Intel 7 (10 нм). Анонсированы модели Atom C1100, Atom C1110 и Atom C1130 с двумя, четырьмя и восемью E-ядрами соответственно (без поддержки многопоточности). Показатель TDP равен 10, 13 и 32 Вт. Тактовая частота и объём L2-кеша в первых двух случаях составляет 2,1 ГГц и 2 Мбайт соответственно, в третьем — 2,5 ГГц и 4 Мбайт. Объём L3-кеша во всех случаях составляет 6 Мбайт. Новинки поддерживают работу с LPDDR5-5200 (ECC) объёмом до 32 Гбайт. Если взглянуть на сравнение спецификаций чипов, то можно заметить, что для C1100 почему-то заявлена поддержка восьми каналов памяти, что наверняка является опечаткой, поскольку для C1110 и C1130 указаны два канала. Линий PCIe 4.0 в CPU 20 шт., они могут быть задействованы по схеме x16 + x4 или два x8 + x4. Одним из первых продуктов на платформе Atom Arizona Beach стало устройство Valencia Network Appliance (на изображении), анонсированное компанией Silicom Ltd. Оно может применяться, например, для SD-WAN или IoT. Новинка может комплектоваться любым из перечисленных процессоров, а объём оперативной памяти LPDDR5 составляет 4, 8, 12 или 16 Гбайт (до 32 Гбайт в будущем). В оснащение Valencia Network Appliance могут входить модули UFS SSD (от 32 Гбайт до 1 Тбайт), eMMC (4–256 Гбайт) и NVMe M.2 SSD. Есть адаптеры Wi-Fi 6Е и Bluetooth LE, а опционально доступны два модуля 4G/5G (плюс два слота для SIM-карт и поддержка eSIM). Присутствуют четыре сетевых порта 2.5GbE, консольный порт RJ-45, разъёмы Micro-USB и USB 3.2 Type-A. При необходимости заказчики могут выбрать вариант с двумя портами 10GbE SFP+, двумя портами 1GbE RJ45 с поддержкой PoE++ или двумя разъёмами 1GbE SFP. Устройство может комплектоваться пассивной или активной системой охлаждения. В первом случае габариты составляют 220 × 180 × 60 мм, во втором — 220 × 180 × 44 мм. Питание подаётся через внешний блок.
08.06.2023 [17:40], Алексей Степин
128-ядерные процессоры AMD EPYC Bergamo на базе Zen 4c получили «удвоенные» чиплеты и высокую плотность компоновкиСреди требований, накладываемых к процессору для облачных серверов, числится максимизация производительности в пересчёте на процессорный разъём. В связи с рядом ограничений, в том числе, физического характера, рост этого показателя замедлился. Поэтому крайне важны, чтобы новые чипы могли повысить энергоэффективность и снизить совокупную стоимость владения инфраструктурой. AMD впервые в истории готовится представить x86-процессор, изначально созданный для гиперскейлеров — EPYC Bergamo. В основе новинок лежит оптимизированная архитектура Zen 4 — Zen 4c. Логически она не отличается от прародительницы, но доработки «кремния» позволили компании выпустить 128-ядерный процессор в том же форм-факторе, что и 96-ядерный EPYC Genoa. В качестве I/O-модуля используется тот же блок Floyd, располагающий 128 линиями PCI Express 5.0 и прочими характеристиками, свойственными процессорам AMD в конструктиве SP5. SemiAnalysis провёл исследование отличий Genoa и Bergamo. Bergamo включает всего 8 модулей CCD (Vindhya), в то время как Genoa требует 12 (Durango) даже с учетом существенно меньшего количества ядер — в один CCD теперь умещается 16 ядер против 8 (два CCX). Тем не менее, общий объём кеша L3 у новинки меньше, 256 Мбайт против 384 Мбайт. Также снижена с 3,7 до 3,1 ГГц максимальная тактовая частота. Логика на кристалле упакована более плотно, уменьшено количество физических разделов (partitions), применены менее производительные двухпортовые ячейки SRAM 6T (8T у Genoa). Также процессоры лишились TSV-контактов, так что поддержки 3D V-Cacne Bergamo лишены изначально. Первыми в серии станут 128-ядерный EPYC 9745 и 112-ядерный EPYC 9734. Оба процессора используют 12 каналов DDR5-4800 с совокупной пропускной способностью 460 Гбайт/с. Теплопакет удалось удержать в прежних 360–400 Вт. Возможен выпуск кастомных версий, учитывающих потребности крупных облачных провайдеров, но сколько и каких модифицированных Bergamo будет произведено, пока неизвестно.
05.06.2023 [12:28], Сергей Карасёв
Процессоры AMD EPYC Rome перестают функционировать через 1044 дня непрерывной работыСерверные процессоры AMD EPYC 7002 (Rome), по сообщению ресурса Tom's Hardware, «зависают» спустя 1044 дня непрерывной работы — это приблизительно 2,86 года. После этого требуется перезагрузка сервера для восстановления его нормального функционирования. Проблема связана с тем, что ядро названных чипов не может выйти из энергосберегающего режима CC6. Говорится, что конкретные сроки возникновения сбоя могут варьироваться: они зависят от функции Spread Spectrum и опорной частоты REFCLK (используется процессором для отслеживания времени). Однако пользователь Reddit с ником acid_migrain говорит, что на самом деле проблема проявляется через 1042 суток и примерно 12 часов, а не 1044 дня, как предупреждает сама AMD. Дело в том, что счётчик TSC (Time Stamp Counter), работающий на частоте 2800 МГц, зависает при значении 0x3800000000000000. Это 2800 × 106 × 1042,5, то есть, спустя 1042 дня и 12 часов после начала отсчёта. «Здесь слишком много нулей, чтобы это было совпадением», — отмечает acid_migrain. AMD не планирует исправлять ошибку. Избежать сбоя, как уже отмечалось, можно путём периодической перезагрузки сервера. Второй вариант — отключить возможность перехода в состояние CC6. Наблюдатели говорят, что данная особенность EPYC Rome вряд ли будет критична для большинства пользователей: почти три года непрерывной работы — это большой срок, в течение которого, скорее всего, будут выполняться перезагрузки в связи с техническим обслуживанием или обновлениями.
30.05.2023 [13:38], Сергей Карасёв
Китай представил новый RISC-V процессор семейства Xiangshan и ОС AolaiКитайская академия наук, по сообщению ресурса China Daily, представила новый процессор семейства Xiangshan, построенный на архитектуре RISC-V. Ожидается, что появление этого изделия снизит зависимость КНР от зарубежных технологий, что особенно важно в свете санкций со стороны Соединённых Штатов. О проекте Xiangshan говорилось ещё в середине 2021 года. Тогда были раскрыты планы по выпуску 28-нм чипов с возможностью перехода на нормы 7 нм в 2022 или в 2023 году. И вот теперь анонсированы решения нового поколения. По имеющейся информации, представленные процессоры функционируют на тактовой частоте до 2,0 ГГц. Утверждается, что по производительности ядра Xiangshan превосходят Arm Cortex-A76. Заявлена поддержка большого количества «сложных высокоскоростных периферийных интерфейсов». Кроме того, Китайская академия наук анонсировала ОС Aolai для чипов с открытой архитектурой RISC-V. К сожалению, подробности о новой программной платформе не раскрываются, но говорится, что доступ к технологиям, лежащим в её основе, получат участники сообщества RISC-V. Отмечается, что Китайская академия наук придаёт большое значение созданию экосистем технологий с открытым исходным кодом. В 2018 году был сформирован Китайский альянс RISC-V для развития проектов в соответствующей области. Чип Xiangshan и ОС Aolai являются «двумя заметными достижениями, которые демонстрируют стремление Китая укрепить экосистему RISC-V».
29.05.2023 [07:30], Сергей Карасёв
NVIDIA начала массовое производство суперчипов Grace Hopper для генеративного ИИКомпания NVIDIA в ходе выставки Computex 2023 сообщила о начале серийного производства суперчипов GH200 Grace Hopper, предназначенных для построения НРС-систем и платформ генеративного ИИ. Ожидается, что изделия возьмут на вооружение ведущие облачные провайдеры и гиперскейлеры, включая Google, Meta✴ и Microsoft. В состав Grace Hopper входят 72-ядерный Arm-процессор NVIDIA Grace и ускоритель NVIDIA H100 с 96 Гбайт HBM3. Объём общей для обоих кристаллов памяти составляет 576 Гбайт (480 Гбайт LPDDR5x). Кристаллы соединены между собой шиной NVLink-C2C, обеспечивающей пропускную способность 900 Гбайт/с: это приблизительно в семь раз больше по сравнению с PCIe 5.0. Заявленный уровень производительности GH200 — 4 Пфлопс с использованием Transformer Engine. «Генеративный ИИ быстро трансформирует IT-пространство, предоставляя новые возможности и ускоряя открытия в здравоохранении, финансах, бизнес-сфере и многих других отраслях. С началом серийного выпуска суперчипов Grace Hopper производители по всему миру вскоре представят ускоренные инфраструктуры для решения ИИ-задач корпоративного класса на основе уникальных массивов данных», — сказал Иэн Бак (Ian Buck), вице-президент HPC-подразделения NVIDIA. Говорится, что в число производителей серверов с ускорителями NVIDIA входят такие компании, как Cisco, Dell Technologies, Gigabyte, HPE, Lenovo, Supermicro, Eviden (Atos). Среди тайваньских партнёров компании были названы AAEON, Advantech, Aetina, ASRock Rack, ASUS, GIGABYTE, Ingrasys, Inventec, Pegatron, QCT, Tyan, Wistron и Wiwynn. Изделия NVIDIA H100 уже применяют в составе своих платформ облачные провайдеры AWS, Cirrascale, CoreWeave, Google Cloud, Lambda, Microsoft Azure, Oracle Cloud, Paperspace и Vultr. Системы нового поколения на базе NVIDIA Grace, Hopper и Ada Lovelace обеспечат поддержку полного набора ПО NVIDIA, включая NVIDIA AI Enterprise, NVIDIA Omniverse и NVIDIA RTX. Платформы на основе суперчипов GH200 Grace Hopper станут доступны позднее в текущем году.
19.05.2023 [10:10], Сергей Карасёв
Ampere представила процессоры AmpereOne: до 192 ядер Arm, 8 каналов DDR5 и 128 линий PCIe 5.0Компания Ampere анонсировала процессоры серии AmpereOne, предназначенные для использования в серверах и оборудовании для дата-центров. Утверждается, что по сравнению с изделиями предыдущих поколений — Ampere Altra и Ampere Altra Max — новые чипы обеспечивают более высокие показатели производительности и энергоэффективности, а также обладают улучшенной масштабируемостью. Процессоры AmpereOne основаны на кастомизированных ядрах собственной разработки Ampere с набором инструкций Arm. Задействована чиплетная компоновка. Изготавливаются решения на предприятии TSMC на основе комбинации технологий с нормами 5 и 7 нм. В семейство AmpereOne вошли пять моделей — со 136, 144, 160, 172 и 192 ядрами. Каждое ядро способно обрабатывать один поток инструкций. Объём кеша L2 составляет 2 Мбайт в расчёте на ядро; размер кеша L1 — 16 Кбайт для инструкций и 64 Кбайт для данных. Кроме того, есть 64 Мбайт системного кеша. Тактовая частота достигает 3,0 ГГц. Конструкция AmpereOne включает восемь каналов памяти DDR5 с поддержкой ECC: сервер может быть оборудован 16 слотами DIMM с возможностью использования до 8 Тбайт ОЗУ. Доступны 128 линий PCIe 5.0. Упомянута поддержка Armv8.6+ и SBSA 5. Чипы имеют исполнение FCLGA (5964-Pin). Ampere отмечает, что процессоры AmpereOne ориентированы прежде всего на облачные платформы и среды виртуализации. Они обеспечивают высокую плотность вычислений и возможность формирования виртуальных машин, использующих от одного vCPU. Кроме того, достигается высокая производительность при ИИ-нагрузках (BF16). Заявленное энергопотребление AmpereOne составляет 1,8 Вт в расчёте на ядро, или от 200 до 350 Вт на сокет в зависимости от модификации решения.
17.05.2023 [21:40], Сергей Карасёв
Кибератака PMFault позволяет удалённо уничтожать серверные процессоры повышенным напряжениемДва исследователя в области информационной безопасности, аспирант Зитаи Чен (Zitai Chen) и профессор Дэвид Освальд (David Oswald), по сообщению The Register, на конференции Black Hat Asia 2023 рассказали о новой кибератаке, которая может использоваться для вывода из строя CPU в серверах на базе определённых материнских плат. Схема получила название PMFault. Суть атаки сводится к использованию шины управления питанием PMBus на основе протокола I2C для повышения напряжения, подаваемого на центральный процессор. В результате, CPU может стать полностью неработоспособным без возможности последующего восстановления. Так, в ходе экспериментов исследователи уничтожили два чипа Intel Xeon. Для организации атаки физический доступ к серверу необязателен. Нападение может быть осуществлено через I2C-подключение через ОС с правами администратора или через уязвимости в контроллере Baseboard Management Controller (BMC), который входит в оснащение многих серверных материнских плат. Отмечается, что проблема в числе прочего затрагивает платы Supermicro с поддержкой IPMI (X11, X12, H11 и H12), а также некоторые платы ASRock. Более того, утверждают исследователи, теоретически атака может быть осуществлена на любые системы с доступом к PMBus посредством I2C. Компания Supermicro уже отреагировала на сообщения о проблеме и выпустила необходимые исправления. На сайте GitHub доступен инструмент PMBusDetect, при помощи которого можно определить возможность проведения атаки PMFault.
16.05.2023 [09:23], Сергей Карасёв
Индия представила свой первый серверный процессор AUM: 96 ядер и 96 Гбайт памяти HBM3Центр развития передовых вычислений (C-DAC) Департамента электроники и информационных технологий Министерства коммуникаций и информационных технологий Индии представил первый в стране процессор для серверов и НРС-систем. Изделие под названием AUM выйдет на коммерческий рынок в текущем или следующем году. Решение имеет чиплетную компоновку на базе двух модулей A48Z, каждый из которых насчитывает 48 вычислительных ядер Zeus с архитектурой Arm. Таким образом, суммарное количество ядер достигает 96. Тактовая частота составляет 3,0 ГГц (до 3,5 ГГц в турбо-режиме); показатель TDP варьируется от 280 до 320 Вт. Новинка будет изготавливаться на предприятии TSMC по 5-нм технологии. Чип содержит 96 Мбайт кеша L2 и 96 Мбайт системного кеша. Изделие получило 96 Гбайт памяти HBM3 и 8-канальный контроллер DDR5-5200; кроме того, имеется доступ к 64 Гбайт памяти HBM3-5600. Таким образом, задействована трёхуровневая подсистема памяти. Упомянуты до 128 линий PCIe 5.0 с поддержкой CXL. Процессор AUM может применяться в двухсокетных серверах. Заявленная производительность превышает 4,6 Тфлопс в расчёте на разъём. Реализованы различные средства обеспечения безопасности, в том числе функция Secure Boot и криптографические алгоритмы. |
|