Материалы по тегу: hardware
02.09.2024 [11:21], Руслан Авдеев
Спустя годы Google начала строительство второго кампуса ЦОД в Латинской Америка — в УругваеВ Google объявили, что после специального планирования и анализа, наконец, сделан очередной шаг на пути строительства второго дата-центра в Латинской Америке. По данным Datacenter Dynamics, речь идёт об объекте в уругвайском Канелонесе (Canelones). Объявлено, что в проект инвестируют $850 млн, но спецификации площадки пока неизвестны. IT-гигант приобрёл 30 га в уругвайской зоне свободной торговли Parque de las Ciencias в мае 2021 года, а впервые планы создания кампуса были анонсированы ещё в 2020 году. Изначально в поданных местным властям документах сообщалось о намерении построить ЦОД при посредничестве дочернего подразделения Eleanor, план получил название Project Teros. В ноябре прошлого года Google скорректировала планы строительства. Сомнения в целесообразности возникли у многих в связи с вероятным использованием компанией больших объёмов чистой воды на фоне сильных засух в стране. Например, по этой причине пришлось пересмотреть проект в Чили. Изначально в рамках проекта планировалось использовать до 7,6 млн литров питьевой воды ежедневно, пересмотренный проект не такой масштабный и в основном предусматривает использование систем воздушного охлаждения. В Google сообщают, что сегодня управляют 28 кампусами ЦОД в 11 странах. Свой первый дата-центр в Латинской Америке IT-гигант запустил в Чили в 2015 году. Кроме того, компания управляет облачным регионом в Сан-Паулу (Бразилия). Компания также работает над прокладкой подводного кабеля Firmina, который соединит побережье Южной Каролины в США, курортный Лас-Тонинас в Аргентине (Las Toninas), Прайя-Гранде в Бразилии (Praia Grande) и Пунта-дель-Эсте в Уругвае. Google уже является оператором кабеля Tannat совместно с Antel Uruguay — он связывает те же локации. Примечательно, что пока никто из крупных облачных провайдеров не объявлял о планах запуска объектов в Уругвае. По данным DataCenterMap, в стране всего семь колокейшн-объектов. При этом все управляются местными бизнесами, а шесть расположены в столице — Монтевидео, лишь один за её пределами — в Мальдонадо (Maldonado).
02.09.2024 [11:02], Сергей Карасёв
Blue Owl, Chirisa и PowerHouse сформировали СП с активами на $5 млрд по созданию ЦОД для CoreWeaveФонды под управлением Blue Owl Capital, Chirisa Technology Parks (CTP) и PowerHouse Data Centers объявили о заключении соглашения по формированию совместного предприятия, которое займётся созданием крупномасштабных ЦОД для компании CoreWeave. На эти цели будет выделено до $5 млрд. Стартап CoreWeave основан в 2017 году. Изначально компания занималась майнингом криптовалют, а затем переориентировалась на вычисления общего назначения и хостинг проектов генеративного ИИ. В настоящее время CoreWeave предоставляет специализированные облачные ИИ-решения. Компания активно развивает инфраструктуру дата-центров для ИИ. Соглашение между Blue Owl, Chirisa и PowerHouse предусматривает быстрое развёртывание в рамках совместного предприятия дата-центров «под ключ» для нагрузок ИИ и НРС. Помимо CoreWeave, использовать такие ЦОД смогут другие гиперскейлеры и корпоративные заказчики. На первом этапе в 2025–2026 гг. в CoreWeave получит 120 МВт в кампусе CTP общей площадью около 14,2 га недалеко от Ричмонда (Вирджиния, США). В дальнейшем планируются строительство новых и модернизация уже существующих площадок в Нью-Джерси, Пенсильвании, Техасе, Кентукки и Неваде. CTP, принадлежащая Chirisa Investments, была основана в конце 2022 года. Первый ЦОД компании мощностью 28 МВт в кампусе в Ричмонде, известный как CTP-01, недавно был сдан в аренду CoreWeave. Кроме того, CTP владеет площадками в Вирджинии, Иллинойсе, Вашингтоне и Нью-Джерси: на сегодняшний день доступны 46 450 м2 ЦОД-площадей, а на этапе разработки находятся мощности более 400 МВт. В свою очередь, фирма PowerHouse, полностью принадлежащая American Real Estate Partners, в настоящее время реализует 30 проектов дата-центров, находящихся в стадии планирования или строительства. Суммарная мощность этих объектов превысит 2,3 ГВт; они расположатся в Вирджинии, Техасе, Неваде и Северной Каролине. Blue Own — управляющая компания с активами на сумму $192 млрд.
02.09.2024 [11:00], Сергей Карасёв
AAEON представила одноплатный компьютер RICO-MX8P с чипом NXP i.MX 8M Plus в формате Pico-ITX PlusКомпания AAEON анонсировала одноплатный компьютер RICO-MX8P, предназначенный для использования в индустриальной и коммерческой сферах. Изделие выполнено в форм-факторе Pico-ITX Plus с размерами 100 × 80 мм. Говорится о совместимости с Debian 11 (Kernel 5.10). Установлен процессор NXP i.MX 8M Plus с четырьмя ядрами Arm Cortex-A53 с тактовой частотой до 1,6 ГГц, ядром реального времени Arm Cortex-M7 (800 МГц), GPU-блоками Vivante GC7000UL 3D GPU и Vivante GC520L 2D GPU, а также VPU-модулем с поддержкой кодирования и декодирования видео 720p60 H.265/H.264. Опционально может быть добавлен ИИ-ускоритель с производительностью 2,3 TOPS. Объём оперативной памяти LPDDR4 может составлять 2, 4 или 8 Гбайт. Есть флеш-модуль eMMC вместимостью 16 Гбайт и слот для карты MicroSD. Через коннектор M.2 2230 E-Key (PCIe 3.0 x1) может быть подключён модуль Wi-Fi/Bluetooth. Кроме того, предусмотрен разъём mini PCIe для сотового модема 3G/4G (плюс слот Nano-SIM). В оснащение входит сетевой контроллер 1GbE. Одноплатный компьютер располагает интерфейсами HDMI 2.0 (4K× 2K @ 60 Гц), LVDS (4/8 линий), MIPI DSI (4 линии) и MIPI CSI (4 линии), портами USB 3.2 Gen1 Type-C, USB 3.2 Gen1 Type-A и USB 2.0 Type-A, гнездом RJ-45 для сетевого кабеля, последовательным портом, 40-контактным коннектором FPC для карты расширения (CAN Bus, 2 × I2C и пр.), комбинированным аудиогнездом на 3,5 мм. Диапазон рабочих температур простирается от 0 до +60 °C. Заявленный показатель MTBF (средняя наработка на отказ) — 100 тыс. часов.
02.09.2024 [08:38], Владимир Мироненко
Квартальные результаты Pure Storage, NetApp и Nutanix превысили прогнозы Уолл-стрит, но акции выросли только у последнейАкции поставщиков решений для хранения данных Pure Storage Inc. и NetApp Inc. упали в ходе расширенных торгов после подведения квартальных итогов несмотря на то, что их прибыль и выручка превзошли ожидания аналитиков. У Nutanix Inc. , наоборот, акции выросли, поскольку ей удалось добиться наилучших результатов, пишет ресурс SiliconANGLE. Nutanix превзошла прогнозы Уолл-стрит, благодаря чему её акции выросли более чем на 15 % после закрытия торгов. Акции Pure Storage упали более чем на 16 %, а у NetApp — более чем на 5 % после того, как обе компании предупредили о более длительных циклах продаж. Pure Storage сообщила о скорректированной прибыли (non-GAAP) на акцию за II квартал, закончившийся 4 августа, в размере $0.44 при выручке в размере $763,8 млн (рост год к году на 11 %), в то время как аналитики ожидали прибыль в $0,37 на акцию при выручке в размере $756 млн. В целом компания получила чистую прибыль в размере $35,6 млн, в то время как год назад у неё были убытки в размере $7,1 млн. В свою очередь, NetApp получила скорректированную прибыль (non-GAAP) за I квартал 2025 финансового года, завершившийся 26 июля, в размере $1,56 на акцию (годом ранее — $1,15) при общем объёме продаж в $1,54 млрд (рост 8 %) и также превзошла ожидания аналитиков Уолл-стрит, прогнозировавших прибыль (non-GAAP) в размере $1,45 на акцию при продажах в $1,53 млрд. Чистая прибыль (GAAP) за этот период составила $248 млн, превысив показатель годичной давности в $149 млн. Из трёх компаний наилучшие результаты показала Nutanix, получившая скорректированную прибыль (Non-GAAP) в размере $0,27 на акцию в IV квартале 2024 финансового года, завершившегося 31 июля 2024 года, при продажах в $548 млн, что на 10 % больше, чем годом ранее. Прогноз Уолл-стрит по прибыли (Non-GAAP) был равен $0,20 на акцию при продажах в $537,7 млн. Причиной падения акций Pure Storage стал её прогноз. Компания заявила, что снижает свой годовой прогноз по продажам подписок до $500 млн по сравнению с предыдущим прогнозом почти в $600 млн. Вместе с тем компания сохранила свой общий прогноз продаж в размере $3,1 млрд. При этом у Pure Storage выросла на 25 % год к году выручка от подписок до $361,2 млн. Последние пару лет компания подталкивает клиентов к переходу с разовых покупок оборудования на платформы хранения на основе подписки, чтобы обеспечить более регулярный доход. Аналитик NAND Research Inc. Стив Макдауэлл (Steve McDowell) рассказал SiliconANGLE, что рост продаж подписок стал основной причиной ее высоких показателей. «Неудивительно, что клиенты так активно реагируют на предложения подписки Pure», — говорит он. Председатель правления и главный исполнительный директор Pure Storage Чарльз Джанкарло (Charles Giancarlo) сообщил об «удлинении» переговоров по более крупным подписным сделкам. Тем не менее, компания дала прогноз на текущий квартал по выручке в размере $815 млн при оценке Уолл-стрит в размере $811 млн. Макдауэлл заявил, что снижение цены акций Pure Storage стало прямым следствием этих удлинённых циклов продаж, которые являются причиной её более низких краткосрочных прогнозов. Аналитик также охарактеризовал распространение продуктов компании на QLC SSD высокой плотности, таких как FlashArray//E и FlashBlade//E, как повод для оптимизма. «Эти продукты напрямую конкурируют с традиционными системами на основе жёстких дисков Nearline для хранения и показывают, что предприятия начинают выбирать флеш-память вместо HDD по мере наступления циклов замены», — пояснил он. Отметим, что с начала года акции Pure Storage выросли более чем на 70 %. NetApp, специализирующаяся на разработке решений для хранения и управления данными, также сообщила о значительном увеличении продаж по подписке, отметив, что её годовой регулярный доход (ARR) от массивов хранения All-Flash вырос на 21 % с $2,8 млрд год назад до $3,4 млрд в конце квартала. Компания сообщила, что на конец квартал было выставлено счетов на $1,45 млрд при $1,3 млрд годом ранее. Счета — ключевой показатель эффективности, который приблизительно отражает суммы, которые компания выставила клиентам в квартале, но которые ещё не были оплачены. То есть он отражает будущий доход от услуг на основе подписки. NetApp получила доход от гибридного облака в размере $1,38 млрд, что больше дохода в $1,28 млрд годом ранее. Доход от публичного облака составил $159 млн, немного превысив доход в $154 млн годом ранее. В текущем квартале NetApp ожидает выручку в размере $1,565–1,715 млрд — $1,64 млрд в середине прогнозного диапазона, что немного выше оценки аналитиков Уолл-стрит в размере $1,63 млрд. Компания также повысила свой годовой прогноз выручки до $6,58 млрд, что выше более раннего прогноза в $6,55 млрд. С начала 2024 года акции NetApp выросли более чем на 50 % до нынешнего спада. Рост акций Nutanix объясняется не только хорошими результатами, но и оптимистичным прогнозом на весь год. Компания ожидает в 2025 финансовом году выручку в размере от $2,435 до $2,465 млрд, что немного выше в серединном диапазоне целевого показателя Уолл-стрит в размере $2,43 млрд. Гендиректор Nutanix Раджив Рамасвами (Rajiv Ramaswamy) сообщил ресурсу SiliconANGLE, что, по его мнению, 2025 финансовый год станет хорошим годом для обеспечения устойчивого роста и прибыльности, добавив, что все основные показатели эффективности компании демонстрируют улучшение по сравнению с прошлым годом. С начала года стоимость акций Nutanix увеличились на 11 % до нынешнего роста.
01.09.2024 [20:15], Сергей Карасёв
Для облаков и ИИ: QCT представила серверы на процессорах Intel Xeon 6Компания Quanta Cloud Technology (QCT) анонсировала серверы на процессорах Intel Xeon 6, ориентированные на поставщиков облачных услуг, телекоммуникационных провайдеров и операторов ЦОД. Дебютировали решения серий QuantaGrid и QuantaPlex для различных рабочих нагрузок, включая задачи ИИ и НРС. Отмечается, что серверы QCT построены с применением модульных компонентов, для монтажа которых не требуются инструменты. Доступны варианты с воздушным и жидкостным охлаждением, различной компоновкой подсистемы хранения данных, поддержкой ускорителей одинарной и двойной ширины. Реализована возможность горячей замены отдельных узлов, таких как блоки питания и вентиляторы. Представлены модели QuantaGrid D55X-1U и QuantaGrid D55Q-2U типоразмера 1U и 2U соответственно. Они допускают установку двух чипов Xeon 6700E (Sierra Forest) с TDP до 350 Вт. Возможна установка 32 модулей DDR5-6400 RDIMM или 16 модулей MRDIMM (до 8000 МГц). У 1U-версии конфигурация подсистемы хранения в зависимости от исполнения включает: 12 × SFF NVMe/SATA/SAS SSD, 16 × E1.S NVMe SSD, 20 × E3.S 1T NVMe или 4 × E3.S 1T NVMe + 8 × E3.S 2T CXL. Карты расширения могут монтироваться по схеме 2 × PCIe 5.0 x16 FHHL, 2 × PCIe 5.0 x16 OCP 3.0 SFF и 1 × DC-SCM или 3 × PCIe 5.0 x16 HHHL, 2 × PCIe 5.0 x16 OCP 3.0 SFF и 1 × DC-SCM. Для сервера формата 2U предусмотрены варианты с поддержкой следующих накопителей: 12 × LFF SATA/SAS HDD или 12 × SFF NVMe, 24 × SFF NVMe/SATA/SAS или 12 × E3.S 1T NVMe + 12 × E3.S 2T CXL. Допускаются различные варианты монтажа карт PCIe 5.0 x8 FHHL, PCIe 5.0 x16 FHFL и PCIe 5.0 x8 HHHL. Серверы комплектуются двумя блоками питания с сертификатом 80 Plus Titanium (до 2700 и 3200 Вт соответственно). Кроме того, анонсированы модели QuantaGrid S55R-1U и QuantaGrid S55J-2U формата 1U и 2U с поддержкой чипов Xeon 6700 с производительными P-ядрами (Granite Rapids). Раскрываются характеристики только 1U-сервера: один процессор с TDP до 350 Вт, 16 слотов для модулей DDR5-5200 RDIMM, 12 посадочных мест для SFF-накопителей NVMe/SATA/SAS SSD, два слота PCIe 5.0 x16 FHHL + слот OCP 3.0 NIC SFF, два коннектора M.2 2230/2280 PCIe 5.0, два блока питания 80 Plus Titanium мощностью до 2000 Вт. Дебютировали также серверы QuantaPlex S25Z-2U и QuantaPlex S45Z-2U типоразмера 2U с двумя и четырьмя узлами. Каждый узел рассчитан на один процессор Xeon 6700 с TDP до 350 Вт, 16 модулей DDR5-6400 RDIMM, а также два SSD M.2. Двухузловая версия поддерживает до трёх карт расширения PCIe 5.0 и два SFF-накопителя NVMe/SATA SSD на узел. У четырёхузловой модификации возможна установка одной карты PCIe 5.0, а также двух накопителей E1.S NVMe SSD или трёх устройств SFF NVMe SSD на узел. Вышел 7U-сервер QuantaGrid D74H-7U для ресурсоёмких нагрузок НРС и ИИ. Он допускает установку двух процессоров Intel Xeon Emerald Rapids или Sapphire Rapids с показателем TDP до 350 Вт. Есть 32 слота для модулей памяти DDR5-5600 RDIMM суммарным объёмом до 8 Тбайт. Предусмотрены отсеки для 18 SFF-накопителей NVMe SSD. Возможна установка восьми ускорителей NVIDIA H100 (SXM5). Слоты расширения выполнены по схеме 2 × PCIe 5.0 x16 OCP 3.0 SFF и 10 × PCIe 5.0 x16 OCP 3.0 TSFF. Применены шесть блоков питания 80 Plus Titanium на 4000 Вт. Наконец, представлен высокопроизводительный сервер QuantaGrid D75E-4U формата 4U, который, как утверждается, обеспечивает максимальную гибкость при работе с LLM, ИИ и HPC. Он оснащён двумя процессорами Intel Xeon 6 с TDP до 350 Вт и поддерживает до восьми GPU-ускорителей PCIe следующего поколения с воздушным охлаждением и TDP до 600 Вт.
31.08.2024 [22:02], Владимир Мироненко
Продажи серверов Dell взлетели на 80 % — компания переманивает крупных заказчиков ИИ-систем у SupermicroDell Technologies объявила финансовые результаты II квартала 2025 финансового года, завершившегося 2 августа 2024 года. Выручка компании составила $25,03 млрд, превысив на 9 % результат аналогичного квартала предыдущего финансового года, а также консенсус-прогноз аналитиков, опрошенных LSEG, в размере $24,53 млрд. Чистая прибыль увеличилась на 85 % до $841 млн с $455 млн годом ранее. Прибыль на акцию выросла на 86 % с $0,63 до $1,17. Скорректированная чистая прибыль (Non-GAAP) на акцию увеличилась на 9 % с $1,74 до $1,89 при консенсус-прогнозе $1,71. Наибольший рост по выручке показало подразделение Infrastructure Solutions Group (ISG), производящее серверы, СХД и другое оборудование для ЦОД, которое принесло доход в размере $11,65 млрд, превысив на 38 % показатель годичной давности, а также прогноз аналитиков Уолл-стрит в размере $10,44 млрд. При этом сегмент Servers and Networking, ответственный за поставку ИИ-серверов на базе ускорителей NVIDIA и AMD, а также традиционных серверов, увеличил продажи год к году на 80 % — с $4,27 до $7,67 млрд. Dell заявила, что $3,1 млрд из этой суммы приходится на продажи ИИ-платформ, реализация которых в предыдущем квартале составила $1,7 млрд. По словам главного операционного директора Dell Джеффа Кларка (Jeff Clarke) у компании растёт портфель заказов на ИИ-серверы, которые предстоит выполнить. В настоящее их объём составляет около $3,8 млрд. Финансовые результаты Dell были объявлены всего через несколько часов после публикации отчёта американской инвестиционной исследовательской компании Hindenburg Research LLC, согласно которому Dell всё активнее переманивает клиентов у конкурентов на рынке серверов, таких как Supermicro Computer Inc. «Tesla закупала свои серверы исключительно у Supermicro, — сообщается в отчёте Hindenburg. — Но недавние отчёты в мае 2024 года и сообщения Илона Маска показывают, что Dell теперь выиграла крупные контракты с Tesla и xAI, что подрывает эксклюзивность Supermicro». В отчёте также цитируется пост самого основателя Dell Майкла Делла (Michael Dell) в соцсети X о том, что он помогает фирме Маска обучать и поддерживать её популярный чат-бот Grok. Ресурс SiliconANGLE отметил, что Dell извлекла выгоду из заявления гендиректора NVIDIA Дженсена Хуанга (Jensen Huang), сделанное в начале этого года, когда тот сказал, что, если собрались купить серверные системы, содержащие самые мощные чипы его компании, лучше всего поговорить с Майклом Деллом. Вместе с тем продажи СХД подразделения ISG упали на 5 % до $3,97 млрд. Также было зафиксировано падение выручки группы Dell Client Solutions Group, которая специализируется на персональных компьютерах и ноутбуках, на 4 % до $12,41 млрд. В текущем квартале Dell прогнозирует выручку в пределах от $24 до $25 млрд, что близко к прогнозу аналитиков StreetAccount, равному $24,6 млрд. Компания также пересмотрела прогноз по выручке на весь 2025 финансовый год. Теперь он составляет $95,5–$98,5 млрд, тогда как раньше он составлял $93,5–$97,5 млрд. Однако средняя точка всё же ниже прогноза Уолл-стрит в $96,34 млрд. После объявления квартальных результатов акции Dell выросли на 3 %. До этого события их рост с начала года составил 48 % с учётом падения на 34 % с момента оглашения предыдущего квартального отчёта.
31.08.2024 [00:39], Алексей Степин
Новые мейнфреймы IBM z получат ИИ-ускорители SpyreВместе с процессорами Telum II для систем z17 компания IBM представила и собственные ускорители Spyre, ещё больше расширяющие возможности будущих мейнфреймов в области обработки ИИ-нагрузок. Они станут дополнением к встроенным в Telum ИИ-блокам. Spyre представляет собой плату расширения с интерфейсом PCIe 5.0 x16 и теплопакетом 75 Вт. Помимо самого нейропроцессора IBM на ней установлено 128 Гбайт памяти LPDDR5, а производительность в ИИ-задачах оценивается производителем в более чем 300 Топс, т.е. новинки подходят для инференса крупных моделей. Сам чип приозводится с использованием 5-нм техпроцесса Samsung 5LPE и содержит 26 млрд транзисторов, а площадь его кристалла составляет 330 мм2. Spyre включает 32 ядра, каждое из которых дополнено 2 Мбайт быстрой скрэтч-памяти. Отдельно отмечено, что последняя не является кешем. При этом заявлена эффективность использования доступных вычислительных ресурсов — свыше 55 % на ядро. Каждое ядро содержит 78 матричных блоков и раздельные FP16-аккумуляторы, по восемь на «вход» и «выход». Интересно, что ядра Spyre и скрэтч-память используют отдельные кольцевые двунаправленные шины разной разрядности (32 и 128 бит соответственно), причём с оперативной памятью на скорости 200 Гбайт/с соединена именно вторая. Каждый узел (drawer) на базе Telum II способен вместить восемь плат Spyre, которые формируют логический кластер, располагающий 1 Тбайт памяти с совокупной ПСП 1,6 Тбайт/с, но, разумеется, каждая плата будет ограничена 128 Гбайт/с из-за интерфейса PCIe 5.0 x16. Spyre создан с упором на предиктивный и генеративный ИИ, благо в полной комплектации новые мейнфреймы могут нести 96 таких ускорителей и развивать до 30 ПОпс (Петаопс). Новинки рассчитаны на работу в средах zCX или Linux on Z, сопровождаются оптимизированным набором библиотек и совместимы с популярными фреймворками Pytoch, TensorFlow и ONNX. Они станут частью программных платформ IBM watsonx и Red Hat OpenShift. Новые мейнфреймы IBM z17 должны дебютировать на рынке в 2025 году. А в собственном облаке IBM будет также полагаться и на Intel Gaudi 3.
30.08.2024 [23:53], Алексей Степин
IBM представила процессор Telum II: 8 × 5,5 ГГц, 2,88 Гбайт L4-кеш, улучшенный ИИ-ускоритель и встроенный DPUНесмотря на доминирование архитектур x86 и Arm, а также растущую популярность RISC-V, востребованность классических мейнфреймов IBM на базе z/Architecture по-прежнему остаётся высокой, и компания продолжает активно развивать данное направление. На этой неделе IBM представила наследника Telum — процессор Telum II, в котором не только получили развитие заложенные ранее идеи, но и были реализованы достаточно серьёзные нововведения. Telum II будет выпускаться Samsung по 5-нм техпроцессу 5HPP (43 млрд транзисторов, 600 мм2). Он по-прежнему имеет восемь ядер с фиксированной рабочей частотой 5,5 ГГц. Сами ядра подверглись усовершенствованию, пусть и достаточно минорному: повышена точность предсказания ветвлений, улучшены механизмы сквозной записи и трансляции адресов. Это должно обеспечить новинке 20 % преимущества в пересчёте на процессорный разъём в сравнении с предшественником. Также благодаря новому техпроцессу удалось снизить площадь ядра на 20 %, а энергопотребление — на 15 %. Для поддержания постоянной тактовой частоты в Telum II используется новый блок управления напряжениями. Серьёзно улучшена подсистема кешей: объём кеш-памяти подрос на 40 %, всего разделов L2-кеша десять. Каждый из них имеет объём 36 Мбайт, а латентность не превышает 3,6 нс. Объёмы виртуальных кешей L3 (11,5 нс) и L4 (48,5 нс) выросли до 360 Мбайт (на процессор) и 2,88 Гбайт (на узел) соответственно. Сама технология виртуального кеширования такова, что текущее свободное место в L2 может использоваться для любой задачи, где может быть востребовано. На 30 % повышена пропускная способность связи чипа с внешним миром, а общение на межузловом уровне теперь шифруется. Встроенный ИИ-блок в Telum II в сравнении с предыдущим поколением стал вчетверо быстрее — 24 Топс. Сам сопроцессор имеет архитектуру, оптимальную для работы с LLM и нагрузками, в которых активно используется сравнительный анализ структурных или текстовых массивов данных. Есть поддержка INT8/FP16. При этом любой ИИ-ускоритель Telum II может работать с любым из ядер в пределах узла (drawer), что в предельной конфигурации даёт производительность на уровне 192 Топс, а для полностью сконфигурированной системы этот показатель равен 768 Топс. «Снаружи» ИИ-ускоритель доступен в виде набора CISC-инструкций. А вот блок DPU дебютировал в Telum II впервые. Что интересно, архитектурно он не располагается «позади» PCI Express, как это бывает в системах на базе x86 или Arm, а имеет когерентное подключение к кешу L2 процессорных ядер, и при этом имеет свою подсистему кешей. Применение DPU, по словам IBM, позволило снизить энергозатраты на обслуживание операций ввода-вывода на 70 %. DPU жизненно необходим, поскольку на мейнфреймах будут работать тысячи инстансов, а самим системам теперь полагается и внешний ИИ-ускоритель Spyre. Всего в состав DPU входит четыре кластера по по восемь программируемых микроядер, каждое из которых имеет кеш L1 объёмом 32+32 Кбайт и работает под управлением кастомных протоколов, разработанных IBM. DPU предоставляет шину PCI Express 5.0 и в полной конфигурации c 32 процессорами и 12 модулями расширения по 16 слотов x16 в каждом система на базе Telum II может работать со 192 адаптерами PCIe. Компания-производитель позиционирует новые системы, как enterpise-решения широкого спектра для сценариев с использованием ИИ, в том числе, в режиме Ensemble AI, в котором одновременно над задачей могут работать модели разного размера и сложности. В этом режиме малая модель выявления мошеннических атак может работать как быстрое средство, а для отдельных, особенно важных транзакций в работу включается более сложная, но и более эффективная модель класса LLM. Процессоры Telum II станут основой как новых мейнфреймов IBM Z, работающих под управлением классической z/OS, так и Linux. Ожидается, что платформы IBM z17 на базе Telum II будут доступны уже в следующем году.
30.08.2024 [13:11], Руслан Авдеев
ИИ-ускорители Intel Gaudi 3 дебютируют в облаке IBM CloudКомпании Intel и IBM намерены активно сотрудничать в сфере облачных ИИ-решений. По данным HPC Wire, доступ к ускорителям Intel Gaudi 3 будет предоставляться в облаке IBM Cloud с начала 2025 года. Сотрудничество обеспечит и поддержку Gaudi 3 ИИ-платформой IBM Watsonx. IBM Cloud станет первым поставщиком облачных услуг, принявшим на вооружение Gaudi 3 как для гибридных, так и для локальных сред. Взаимодействие компаний позволит внедрять и масштабировать современные ИИ-решения, а комбинированное использование Gaudi 3 с процессорами Xeon Emerald Rapids откроет перед пользователями дополнительные возможности в облаках IBM. Gaudi 3 будут применяться и в задачах инференса на платформе Watsonx — клиенты смогут оптимизировать исполнение таких нагрузок с учётом соотношения цены и производительности. Для помощи клиентам в различных отраслях, в том числе тех, деятельность которых жёстко регулируется, компании предложат возможности IBM Cloud для гибкого масштабирования нагрузок, а интеграция Gaudi 3 в среду IBM Cloud Virtual Servers for VPC позволит компаниям, использующим аппаратную базу x86, быстрее и безопаснее использовать свои решения, чем до интеграции. Ранее сообщалось, что модель Gaudi 3 готова бросить вызов ускорителям NVIDIA. В своё время Intel выступила с заявлением о 50 % превосходстве новинки в инференс-сценариях над NVIDIA H100, а также о 40 % преимуществе в энергоэффективности при значительно меньшей стоимости. Позже Intel публично раскрыла стоимость новых ускорителей, нарушив негласные правила рынка.
30.08.2024 [12:43], Сергей Карасёв
Fujitsu займётся созданием ИИ-суперкомпьютера Fugaku Next зеттафлопсного уровняМинистерство образования, культуры, спорта, науки и технологий Японии (MEXT) объявило о планах по созданию преемника суперкомпьютера Fugaku, который в своё время возглавлял мировой рейтинг ТОР500. Ожидается, что новая система, рассчитанная на ИИ-задачи, будет демонстрировать FP8-производительность зеттафлопсного уровня (1000 Эфлопс). В нынешнем списке TOP500 Fugaku занимает четвёртое место с FP64-быстродействием приблизительно 442 Пфлопс. Реализацией проекта Fugaku Next займутся японский Институт физико-химических исследований (RIKEN) и корпорация Fujitsu. Создание системы начнётся в 2025 году, а завершить её разработку планируется к 2030-му. На строительство комплекса MEXT выделит ¥4,2 млрд ($29,06 млн) в первый год, тогда как общий объём государственного финансирования, как ожидается, превысит ¥110 млрд ($761 млн). MEXT не прописывает какой-либо конкретной архитектуры для суперкомпьютера Fugaku Next, но в документации ведомства говорится, что комплекс может использовать CPU со специализированными ускорителями или комбинацию CPU и GPU. Кроме того, требуется наличие передовой подсистемы хранения, способной обрабатывать как традиционные рабочие нагрузки ввода-вывода, так и ресурсоёмкие нагрузки ИИ. Предполагается, что каждый узел Fugaku Next обеспечит пиковую производительность в «несколько сотен Тфлопс» для вычислений с двойной точностью (FP64), около 50 Пфлопс для вычислений FP16 и примерно 100 Пфлопс для вычислений FP8. Для сравнения, узлы системы Fugaku демонстрирует быстродействие FP64 на уровне 3,4 Тфлопс и показатель FP16 около 13,5 Тфлопс. Для Fugaku Next предусмотрено применение памяти HBM с пропускной способностью в несколько сотен Тбайт/с против 1,0 Тбайт/с у Fugaku. По всей видимости, в состав Fugaku Next войдут серверные процессоры Fujitsu следующего поколения, которые появятся после изделий MONAKA. Последние получат чиплетную компоновку с кристаллами SRAM и IO-блоками ввода-вывода, обеспечивающими поддержку DDR5, PCIe 6.0 и CXL 3.0. Говорится об использовании 2-нм техпроцесса. |
|