Лента новостей

22.05.2025 [16:30], Руслан Авдеев

800 В прямо к ускорителям: Infineon и NVIDIA разрабатывают архитектуру HVDC-питания для ИИ ЦОД

Infineon Technologies объединит усилия с NVIDIA для разработки централизованной архитектуры высоковольтного питания постоянным током (HVDC) на 800 В. Она рассчитана на дата-центры, обслуживающие ИИ-системы. Речь идёт о первом в отрасли решении по переходу от децентрализованного к централизованному питанию серверных стоек, сообщает Converge. Впрочем, пока Infineon не будет отказываться от традиционных и переходных архитектур питания.

По данным пресс-службы Infineon, новая архитектура предусматривает преобразование энергии непосредственно на уровне ускорителя, в пределах серверной платы — предполагается, что это позволит поддерживать будущие системы с энергопотреблением более 1 МВт на стойку. Централизованный подход направлен на сокращение этапов преобразования энергии, оптимизацию размещения оборудования в стойках для экономии пространства, а также повышение надёжности и масштабируемости ИИ-инфраструктуры.

Современные ИИ ЦОД используют не вполне эффективные методы распределения питания. В настоящее время система электропитания в дата-центрах децентрализована, а энергоснабжение ИИ-чипов обеспечивается большим количеством блоков и модулей питания. Проблема охлаждения модулей питания в серверных стойках из-за их компактного размещения весьма распространена. Решением может быть вынос преобразователей питания за пределы стоек, что снижает тепловую нагрузку, повышая общую отказоустойчивость системы. Пока речь идёт о выносе модулей питания в отдельную стойку, но в будущем возможно использование единых 800-В шин для ЦОД целиком.

 Источник изображения: NVIDIA

Источник изображения: NVIDIA

Использование высокоплотного централизованного распределения 800 В задаст новые стандарты энергоэффективности и масштабируемости, позволив оптимально использовать ограниченное пространство в серверных стойках. Изменение технологий происходит на фоне роста нагрузок в ИИ ЦОД, некоторые операторы уже эксплуатируют 100 тыс. ускорителей одновременно. Для поддержки новых технологий Infineon использует свой опыт в сфере силовых полупроводников на базе кремния, карбида кремния, нитрида галлия и др.

 Источник изображения: NVIDIA

Источник изображения: NVIDIA

Другими словами, ключевыми особенностями проекта являются:

  • совместная разработка централизованной архитектуры HVDC 800 В;
  • прямое преобразование тока на уровне ускорителей в серверных платах;
  • поддержка плотности более 1 МВт на стойку;
  • использование силовых полупроводников Infineon;
  • сокращение количества этапов преобразования энергии.

По словам Infineon, сочетание её знаний в сфере энергообеспечения и позиций NVIDIA в роли мирового лидера ИИ-индустрии прокладывает дорогу к созданию нового стандарта архитектуры питания дата-центров, позволяющего создавать быструю, эффективную и масштабируемую инфраструктуру.

 Традиционные системы. Источник изображения: NVIDIA

Традиционные системы. Источник изображения: NVIDIA

Высоковольтные системы постоянного тока уже применялись в прошлом, но их внедрение, как сообщает NVIDIA, требует обеспечения безопасности эксплуатации, стандартизации и обучения персонала. NVIDIA и партнёры исследуют экономические и технологические аспекты перехода на 800 В, сравнивая традиционные трансформаторные решения с твердотельными (SST) модулями для оптимизации затрат и надёжности.

 Системы нового типа. Источник изображения: NVIDIA

Системы нового типа. Источник изображения: NVIDIA

В самой NVIDIA утверждают, что новая архитектура обеспечивает масштабируемость от 100 кВт до 1 МВт, а энергоэффективность повысится на уровень до 5 % в сравнении с современными системами на 54/12 В. Попутно снизится использование меди, повысится надёжность и останется задел на будущее, поскольку 1 МВт на стойку — это не предел.

Microsoft и Meta пока что предлагают перейти на использование 400 В DC. Речь о системе Mt. Diablo, спецификации которой предоставляются участникам проекта Open Compute Project (OCP). Идея заключается в разделении стойки на независимые шкафы для компонентов подсистемы питания и вычислительного оборудования. Речь идёт о дезагрегированной архитектуре, позволяющей гибко регулировать мощность в соответствии с меняющимися требованиями. А Veir, к примеру, предлагает дата-центрам перейти на сверхпроводящие силовые кабели.

Постоянный URL: https://servernews.kz/1123263
22.05.2025 [12:43], Сергей Карасёв

ASRock Rack показала серверы NVIDIA HGX B300 и систему XGMRACK GB300 NVL72

Компания ASRock Rack в рамках выставки Computex 2025 представила серверы нового поколения, оснащённые ИИ-ускорителями NVIDIA на архитектуре Blackwell. Кроме того, демонстрируются другие индустриальные и корпоративные продукты, включая материнские платы и системы с процессорами AMD и Intel.

В число новинок вошёл сервер ASRock Rack 8U16X-GNR2 типоразмера 8U с воздушным охлаждением. Он выполнен на платформе NVIDIA HGX B300. По заявления разработчика, достигается в семь раз более высокая ИИ-производительность по сравнению с сопоставимыми системами, оборудованными ускорителями NVIDIA на архитектуре Hopper. Суммарный объём памяти HBM3e составляет около 2,3 Тбайт. Задействованы сетевые адаптеры NVIDIA ConnectX-8 SuperNIC.

Кроме того, ASRock Rack готовит к выпуску сервер 4U16X-GNR2 на базе NVIDIA HGX B300 с жидкостным охлаждением. Обе модели ориентированы на ресурсоёмкие рабочие ИИ-нагрузки, такие как агентные системы, рассуждающие модели и генеративные сервисы.

На стенде ASRock Rack представлено стоечная система XGMRACK на основе NVIDIA GB300 NVL72. Она объединяет 36 чипов NVIDIA Grace и 72 ускорителя NVIDIA Blackwell Ultra. Вычислительные и коммутационные узлы используют на 100 % жидкостное охлаждение. Общий объём памяти HBM3e превышает 20 Тбайт. Применяются решения NVIDIA Quantum-X800 InfiniBand и Spectrum-X Ethernet.

ASRock Rack также представила серверы на модульной архитектуре NVIDIA MGX для масштабируемых ИИ-приложений и периферийных вычислений. В число таких машин входит модель 4UXGM-GNR2 типоразмера 4U с поддержкой двух процессоров Intel Xeon 6700P, 6500P (Granite Rapids) или Xeon 6700E (Sierra Forest).

Доступны 32 слота для модулей оперативной памяти DDR5-6400, 16 посадочных мест для накопителей E1.S с интерфейсом PCIe 5.0 x4, два коннектора М.2 22110/2280 для SSD (PCIe 5.0 x4 и PCIe5.0 x2), восемь слотов PCIe 5.0 x16 FHFL, пять слотов PCIe 5.0 x16 FHHL и один слот PCIe 5.0 x16 HHHL. Установлены контроллер ASPEED AST2600 и четыре блока питания мощностью 1200 Вт с сертификатом 80 PLUS Titanium. 

Постоянный URL: https://servernews.kz/1123260
22.05.2025 [12:36], Руслан Авдеев

На пути к гигаватту: Nebius увеличит капитальные затраты в 2025 году до $2 млрд

Провайдер облачных ИИ-сервисов Nebius (ранее Yandex N.V.) увеличил прогнозируемые капитальные затраты в 2025 году на треть. В отчёте за I квартал сообщается, что теперь капзатраты за год составят порядка $2 млрд — ранее речь шла об $1,5 млрд, сообщает Datacenter Dynamics.

По словам компании, увеличение связано с переносом затрат с IV квартала предыдущего периода на I квартал нового. Кроме того, виновата и «оппортунистическая» стратегия компании — речь идёт о недавно анонсированном суперкомпьютере в Израиле. Изначально израильского проекта за $140 млн в планах не было, но раз появилась такая возможность, то ей было решено воспользоваться, к тому же часть расходов оплатят израильские власти. Базового уровня мощности в 100 МВт компания рассчитывает добиться уже в 2025 году, но её руководство заявляет, что на деле амбиций гораздо больше — со временем планируется выйти на уровень в 1 ГВт.

Сейчас компания располагает возможностью финансировать рост расходов за счёт неосновных активов, долей в сторонних монетизируемых проектах. Так, Nebius косвенно подтвердила, что сейчас идёт раунд сбора средств для Clickhouse, который может довести капитализацию этой компании до $6 млрд, что уже положительно сказалось на оценках самой Nebius. Также Nebius имеет значительные доли в Toloka и Avride. Недавно Toloka получила $72 млн инвестиций от Bezos Expeditions, которой владеет основатель Amazon Джефф Безос (Jeff Bezos).

 Источник изображения: Alexander Grey/unsplash.com

Источник изображения: Alexander Grey/unsplash.com

Также компания намерена получить доступ и к более традиционным источникам средств. В декабре 2024 года Nebius уже привлекала $700 млн в виде акционерного финансирования от Accel, NVIDIA и структур, подконтрольных Orbis Investments. Кроме того, компания завершила квартал с $1,4 млрд на балансе, что подчеркивает её финансовую устойчивость и перспективы для дальнейших инвестиций или роста.

Несмотря на прогнозируемый рост капитальных затрат, Nebius отчиталась о квартальной выручке в размере $55,3 млн, на 385 % больше год к году в сравнении с $11,4 млн в 2024 году. Основным источником средств стала ИИ-инфраструктура компании. Скорректированный убыток по EBITDA за квартал составил $62,6 млн, на 12 % меньше год к году, чистый убыток от продолжающейся деятельности — $113,6 млн. Ожидается, что показатель EBITDA станет положительным в 2025 году. Прогноз головой выручки составляет $500–$700 млн, при этом годовой темп выручки оценивается компанией в $0,75—$1 млрд к концу 2025 года. В любом случае предполагается последовательный рост компании.

 Источник изображения: Alexander Grey/unsplash.com

Источник изображения: Alexander Grey/unsplash.com

Предложение ускорителей NVIDIA Blackwell клиентам даст уверенность в том, что показатели компании будут соответствовать собственным прогнозам. Компания уже предлагает доступ к GB200, а в III квартале начнёт развёртывать Blackwell Ultra (GB300). По словам генерального директора компании Аркадия Воложа (Arkady Volozh), текущая клиентская база компании — новые ИИ-бизнесы, появившиеся в последние пару лет. Большинство из них базируется в США, поэтому Nebius сосредоточена на том, чтобы нарастить мощности в этой стране.

По словам бизнесмена, пока не привлечены передовые ИИ-лаборатории и действительно крупные клиенты, но в Nebius усердно работают над этим — таким клиентам понадобится больше ЦОД. Nebius также присоединилась к платформе NVIDIA DGX Cloud Lepton, которая упрощает облачный доступ к ускорителям NVIDIA. К Lepton также присоединились CoreWeave, Crusoe, Firmus, Foxconn, GMI Cloud, Lambda, Nscale, SoftBank и Yotta Data Services.

Также известно, что компания назначила нового финансового директора — Марию дель Дадо Алонсо Санчес (Maria del Dado Alonso Sanchez), которая уже 1 июня должна сменить на этом посту Рона Джейкобса (Ron Jacobs). Новая CFO имеет за плечами более 25 лет опыта работы на руководящих должностях, в том числе в Amazon, Booking.com, Naspers/OLX и BBG.

Постоянный URL: https://servernews.kz/1123268
21.05.2025 [22:58], Владимир Мироненко

Curator отразила атаку крупнейшего в истории DDoS-ботнета из 4,6 млн устройств

Компания Curator (ранее Qrator Labs) сообщила об успешной нейтрализации атаки самого крупного за всю историю наблюдений DDoS-ботнета, состоявшего из 4,6 млн устройств. Для сравнения, самый большой DDoS-ботнет, выявленный в прошлом году, состоял из 227 тыс. устройств, а крупнейший ботнет, зафиксированный в 2023 году — из 136 тыс. устройств. По данным Curator, 16 мая 2025 года атаке подверглась организация из сегмента «Государственные ресурсы», микросегмент — «Общественные организации».

Атака проводилась в несколько этапов. На первом этапе в ней было задействовано порядка 2 млн устройств. На втором этапе ботнет пополнился ещё 1,5 млн устройств, а на третьем этапе количество устройств достигло 4,6 млн. Как полагают аналитики Curator, преступники в итоге задействовали все имеющиеся ресурсы.

 Источник изображения: Kevin Horvat/unsplash.com

Источник изображения: Kevin Horvat/unsplash.com

Большая часть устройств, входивших в ботнет, была из Южной и Северной Америки. Около 1,37 млн заблокированных во время атаки IP-адресов (30 % всего ботнета), были зарегистрированы в Бразилии, порядка 555 тыс. были из США, 362 тыс. — из Вьетнама, 135 тыс. — из Индии и 127 тыс. — из Аргентины.

 Источник изображения: Curator

Источник изображения: Curator

В Curator сообщили, что с этим ботнетом они сталкивались ранее в этом году, но тогда он включал всего 1,33 млн IP-адресов. Ботнет таких размеров может генерировать десятки миллионов запросов в секунду, что несёт угрозу выхода из строя атакуемых серверов в случае неудовлетворительной организации защиты. По словам Curator, такую атаку может выдержать не каждый провайдер DDoS-защиты, «что потенциально может поставить под угрозу доступность ресурсов всех клиентов одновременно».

Постоянный URL: https://servernews.kz/1123251
21.05.2025 [17:23], Руслан Авдеев

Глава NVIDIA назвал запреты США на экспорт передовых ИИ-чипов в Китай «ошибочными и абсолютно неправильными»

Глава NVIDIA Дженсен Хуанг (Jensen Huang) назвал запреты США на экспорт производительных ИИ-ускорителей в Китай «ошибкой» и «абсолютно неправильной политикой», сообщает The Register. Выступая на выставке Computex на Тайване, Хуанг пожаловался на решение новой администрации запретить продажи в КНР ускорителей NVIDIA H20 — ослабленной версии чипов H800, которые сами по себе являются ухудшенным вариантом H100.

По словам бизнесмена, это решение негативно скажется на выручке и прибыли NVIDIA, что ухудшит возможности платить в США налоги и нанимать сотрудников. Также предполагается, что такая политика навредит человечеству в целом, поскольку половина учёных в области ИИ находятся в Китае, и они же показывают одни из лучших в мире результатов. Хуанг хотел бы, чтобы те могли пользоваться оборудованием NVIDIA, чтобы результаты их работы мог использовать весь мир. Хуанг подчеркнул, что знаменитые продукты китайской DeepSeek, позволяющие выжать максимум из оборудования, создавались на ускорителях NVIDIA. В своё время появление R1 вызвало панику на бирже и обвал акций самой NVIDIA.

При этом китайские бизнесы создают собственные ИИ-ускорители, поэтому политика американских властей «ошибочна», она только ускорит инновации в Китае. NVIDIA, конечно, попытается создать ускорители, соответствующие новым требованиям экспортного контроля США, но пока в NVIDIA «не знают, как ослабить архитектуру Hopper ещё больше», поскольку она и без того максимально ухудшена.

 Источник изображения: NVIDIA

Источник изображения: NVIDIA

Заодно Хуанга похвалил новые правила экспорта ускорителей в большинство других стран, которые стали более демократичными. Хуанг уверен, что изменение политики поможет NVIDIA вырасти, а американским технологиям — занять доминирующие позиции в мире. Он не преминул отметить, что правительствам стоит ускорить выдачу разрешений на проекты генерации энергии для ИИ ЦОД. Заодно Хуанг похвалил политику США по наращиванию местного производства, поскольку ИИ-бум обеспечит спрос и возможности для выпуска большего количества продуктов в США. Впрочем, бизнесмен уверен, что всё делать в стране всё равно не получится — системы NVIDIA полагаются на получение более 1 млн типов компонентов со всего мира.

Также в ходе выступления Хуанг не преминул прорекламировать технологию NVlink Fusion, позволяющую использовать интерконнекты NVIDIA NVLink с ускорителями разных производителей. Директор компании подчёркивает, что его технология значительно лучше «открытого» стандарта UALink. По словам Хуанга, пока пользователи ждут UALink, на что уйдёт не меньше года), NVLink Fusion наберёт популярность. Также бизнесмен опроверг слухи о планах NVIDIA построить новый исследовательский центр в Китае — новые офисные помещения нужны просто потому, что действующим сотрудникам не хватает места.

Постоянный URL: https://servernews.kz/1123222
21.05.2025 [14:34], Руслан Авдеев

Китайская ADA Space вывела на орбиту первые 13 из 2,8 тыс. спутников для создания космического ИИ ЦОД

Китайская аэрокосмическая компания Chengdu Guoxing Aerospace Technology Co. (ADA Space) в рамках миссии Space Computing Constellation 021 успешно вывела на орбиту 12 спутников Xingshidai, призванных стать частью будущего космического ИИ-облака AI Cloud. Спутники вывели с помощью ракеты-носителя Чанчжэн-2D (Long March 2D), сообщает Datacenter Dynamics.

Группировка Xingshidai будет состоять из 2,8 тыс. аппаратов производительностью 740 TOPS каждый. Компания рассчитывает использовать межспутниковую оптическую лазерную связь для передачи данных со скоростью до 100 Гбит/с. Спутники, как ожидаются, будут способны запускать ИИ-модели с 8 млрд параметров для помощи в астрономических наблюдениях, выполняемых с помощью различных космических инструментов, включая рентгеновский поляриметр, разработанный Университетом Гуанси (Guangxi University) и Национальной обсерваторией Китайской академии наук (National Astronomical Observatory of the Chinese Academy of Sciences).

Группировка также обеспечит дистанционное зондирование и поддержку экстренных служб. По словам китайских учёных, поскольку в космосе можно получать большие объёмы данных высочайшего качества, возможность интеллектуальной обработки данных непосредственно на орбите приобрела важное значение.

 Источник изображения: Geronimo Giqueaux / Unsplash

Источник изображения: Geronimo Giqueaux / Unsplash

Основанная в 2018 году компания ADA Space в феврале вышла на Гонконгскую фондовую биржу. Компания, начинавшая как разработчик низкоорбитальных спутников для дистанционного зондирования, постепенно перешла на спутники для ИИ-проектов. В конце 2021 года компания успешно привлекла $55,6 млн от китайских инвестфондов в раунде финансирования серии B, возглавленном Hengjian Holding. До этого в раунде серии A+ был привлечён $21,37 млн, раунд возглавили Aplus Capital и Galaxy Holding Group.

ADA Space — одна из многих компаний, которая выиграла от новой политики Китай, который с 2014 года пытается сделать аэрокосмическую отрасль, в которой доминируют государственные структуры, более открытой для частного капитала. С тех пор сотни аэрокосмических и смежных компаний получили государственную поддержку, в том числе от военных ведомств.

Как заявил недавно представитель структуры China Aerospace Studies Institute, подконтрольной ВВС США, ожидается развитие сотрудничества Китая с коллегами по БРИКС, а также государства поменьше. По словам американских военных, это будет на руку как Китаю, так и другим странам, поскольку освоение космоса в ближайшие десятилетия будет весьма прибыльным делом и все нации захотят принять в этом участие. В этой группе Китай позиционирует себя безусловным лидером.

В идее космических ЦОД нет ничего нового. В марте 2025 года Starcloud (бывшая Lumen Orbit) сообщила, что тестовый запуск группировки спутников состоится этим летом, а в апреле Axiom Space объявила, что планирует развернуть в космосе два узла ЦОД Orbital Data Center к концу 2025 года.

Постоянный URL: https://servernews.kz/1123212
21.05.2025 [12:57], Руслан Авдеев

ИИ-платформа Microsoft Discovery создала жидкость для СЖО за 200 часов вместо нескольких месяцев

Компания Microsoft запустила для корпоративных пользователей в тестовом режиме ИИ-платформу Microsoft Discovery, использующую ИИ-агентов и HPC для помощи учёным, которым не придётся самостоятельно писать код для своих исследований. Потенциал системы продемонстрировали на примере самой Microsoft — ИИ помог создать новейшую жидкость для погружного охлаждения всего за 200 часов вместо нескольких месяцев или даже лет, сообщает VentureBeat.

Microsoft Discovery использовали для поиска охлаждающей жидкости без «вечных» PFAS-химикатов, часто применяемых в иммерсионных СЖО. Регуляторы во всём мире всё чаще запрещают производство и использование этого класса вещества. ИИ Microsoft проверил 367 тыс. веществ-кандидатов, после чего химикат синтезировал один из партнёров компании. Однако сфера применения такого ИИ простирается далеко за пределы создания охлаждающих жидкостей — новые материалы и химикаты требуются в самых разных сферах, но на их поиск часто уходят годы.

Microsoft Discovery позволяет взаимодействовать с «невероятными возможностями» ИИ, используя естественный язык, что полностью меняет весь процесс исследований, говорит компания. Обычно учёным приходилось изучать программирование для того, чтобы создавать вычислительные инструменты. Такая демократизация науки сыграет на руку малым исследовательским группам, у которых нет ресурсов на изучение программирования или привлечения сторонних специалистов в этой сфере. Более того, со временем платформа научится работать и с квантовыми компьютерами, написание кода для которых — ещё более сложная задача.

 Источник изображения: National Cancer Institute/unsplash.com

Источник изображения: National Cancer Institute/unsplash.com

Работа выполняется с помощью специальных ИИ-агентов, специально обученных для выполнения отдельных научных задач — от написания литературного обзора до создания компьютерной симуляции. По словам Microsoft, ИИ-агенты — это чуть ли не целая команда учёных с докторскими степенями в различных науках. Платформа интегрирует друг с другом базовые модели, занимающиеся общим планированием, и модели, специализирующиеся на физике, химии или, например, биологии.

Также Microsoft Discovery позволяет комбинировать закрытые исследовательские данные и результаты уже опубликованных научных исследований по разным дисциплинам, сохраняя прозрачность моделей и контролируя процесс «рассуждений». Для работы с платформой используется интерфейс Copilot, который занимается оркестрацией агентов. Одновременно интерфейс служит и центральным хабом, в котором учёные управляют своей виртуальной ИИ-командой.

 Источник изображения: National Cancer Institute/unsplash.com

Источник изображения: National Cancer Institute/unsplash.com

В платформу встроены защитные механизмы — системе заданы «этические координаты». Также применяется модерация контента с проактивным подходом к выявлению злоупотреблений возможностями платформы — маркируются потенциально вредоносные алгоритмы и действия, поскольку все ИИ-инструменты фактически имеют «двойное назначение». С их помощью можно изобретать не только лекарства, но и опасные биологически опасные субстанции.

Для своей платформы Microsoft выстраивает экосистему с участием представителей самых разных отраслей, от фармацевтики (GSK) до индустрии красоты (Estée Lauder). NVIDIA интегрирует с Discover микросервисы ALCHEMI и BioNeMo NIM для биотехнологий и фармацевтики. В полупроводниковой сфере Microsoft планирует интеграцию решений Synopsys для ускорения разработки чипов. Адаптацией под конкретные отраслевые задачи, развёртыванием и масштабированием платформы займутся Accenture и Capgemini.

 Источник изображения: Microsoft

Источник изображения: Microsoft

Успех Microsoft Discovery будет зависеть от того, насколько эффективно систему смогут интегрировать в текущие научные процессы — многие учёные скептически относятся к новым методикам, так что компании придётся показать всё, на что способен ИИ. По словам Microsoft, будущее науки именно за сочетанием умственных возможностей человека и масштабного ИИ. Microsoft уже провела предварительную демонстрацию Discovery для ограниченного круга структур. Цены на платформу пока не названы, но доступ к к ней будет организован посредством Azure.

Постоянный URL: https://servernews.kz/1123198
21.05.2025 [10:39], Владимир Мироненко

GPU-маркетплейс NVIDIA DGX Cloud Lepton упростит доступ к дефицитным ИИ-ускорителям

NVIDIA анонсировала GPU-маркетплейс NVIDIA DGX Cloud Lepton, которая позволит разработчикам со всего мира, создающим агентские и другие ИИ-приложения использовать NVIDIA Blackwell и другие модели ускорителей в глобальной сети партнёрских облаков (NCP): CoreWeave, Crusoe, Firmus, Foxconn, GMI Cloud, Lambda, Nebius, Nscale, Softbank и Yotta Data Services. Ожидается, что ведущие провайдеры облачных услуг и другие GPU-маркетплейсы также присоединятся к DGX Cloud Lepton.

Разработчики смогут использовать вычислительные мощности ускорителй в определённых регионах как для вычислений по требованию, так и на постоянной основе. «NVIDIA DGX Cloud Lepton свяжет нашу сеть глобальных поставщиков облачных GPU с разработчиками в сфере ИИ, — заявил основатель и генеральный директор NVIDIA Дженсен Хуанг (Jensen Huang). — Вместе с нашими NCP мы строим ИИ-фабрику планетарного масштаба».

По замыслу NVIDIA, платформа DGX Cloud Lepton поможет решить критическую задачу обеспечения разработчиков надёжными, высокопроизводительными ресурсами ускорителей путём унификации доступа к облачным ИИ-сервисам и мощностям собственных ускорителей. Платформа интегрирована с программным стеком NVIDIA, включая микросервисы NIM и NeMo, Blueprints и Cloud Functions.

 Источник изображений: NVIDIA

Источник изображений: NVIDIA

В числе основных преимуществ новой платформы компания назвала:

  • Повышенную производительность и гибкость: маркетплейс предлагает единый опыт разработки, обучения и инференса. Разработчики смогут приобретать здесь мощности ускорителей напрямую у участвующих провайдеров облачных услуг или использовать собственные вычислительные кластеры, что обеспечивает им большую гибкость и контроль.
  • Беспроблемное развёртывание: платформа позволяет развёртывать ИИ-приложения в мультиоблачных и гибридных средах с минимальной эксплуатационной нагрузкой, используя интегрированные сервисы для инференса, тестирования и обучения.
  • Гибкость и суверенитет: платформа предоставляет разработчикам быстрый доступ к ресурсам ускорителей в определённых регионах, что позволяет соблюдать требования суверенитета данных и требования к низкой задержке для чувствительных рабочих нагрузок.
  • Предсказуемую производительность: маркетплейс обеспечивает производительность, надёжность и безопасность корпоративного уровня, гарантируя единообразный пользовательский опыт.

А для самих провайдеров, участвующих в DGX Cloud Lepton, предоставляется ПО для управления, которое обеспечивает диагностику состояния ускорителей в реальном времени и автоматизирует анализ первопричин возникших проблем, избавляя от ручной диагностики и сокращая время простоев.

NVIDIA также анонсировала инициативу Exemplar Clouds, предназначенную для стандартизации прозрачного сравнительного анализа облачной ИИ-инфраструктуры. Это предложение должно решить серьёзную проблему, с которой сталкиваются разработчики и предприятия, развёртывающие рабочие ИИ-нагрузки — прогнозирование эффективности, надёжности и ценовой эффективности облачной платформы. Exemplar Clouds использует NVIDIA DGX Cloud Benchmarking, комплексный набор инструментов и рекомендаций для оптимизации производительности облачных ИИ-нагрузок и количественной оценки связи между стоимостью и производительностью.

Постоянный URL: https://servernews.kz/1123191
21.05.2025 [10:15], Руслан Авдеев

Малайзия проигнорировала США и развернула первую в регионе суверенную ИИ-платформу на чипах Huawei и LLM DeepSeek

Малайзия официально объявила об успешной реализации проекта Strategic AI Infrastructure — теперь это первая в Юго-Восточной Азии страна с полностью суверенным стеком ИИ-технологий. Несмотря на настоятельные рекомендации Министерства торговли США не использовать передовые китайские ускорители вроде Huawei Ascend, новый проект реализован с использованием именно этих продуктов и китайской ИИ-модели семейства DeepSeek — впервые за пределами КНР, сообщает TrendForce.

Как свидетельствует агентство со ссылкой на малайзийские СМИ, местные власти приветствовали запуск новой инфраструктуры, назвав событие важной вехой на пути развития ИИ в стране. Представитель министерства связи Малайзии подчеркнул, что локализация ИИ-моделей вроде DeepSeek и размещение ИИ-серверов на территории страны укрепляет цифровой суверенитет государства.

 Источник изображения: Wengang Zhai/unsplash.com

Источник изображения: Wengang Zhai/unsplash.com

Предполагается, что теперь Малайзия не зависит от зарубежных облаков или ЦОД — вся инфраструктура, от серверов до ИИ-агентов, разрабатывается и управляется на месте. По имеющимся данным, первая суверенная генеративная ИИ-экосистема, оператором которой выступает малайзийская Skyvast Cloud, работает на основе серверов AlterMatic DT250 с восемью ускорителями Huawei Ascend.

Skyvast и китайская компания Leadyo намерены развернуть к 2026 году 3 тыс. высокопроизводительных ускорителей в нескольких зонах в Малайзии. Это будет частью стратегии по масштабированию национальной ИИ-системы за счёт международного и локального сотрудничества.

Примечательно, что в стране фактически проигнорировали предупреждение Министерства торговли США, которое недавно заявило о потенциальных рисках применения китайских ускорителей, а также предостерегло от использования американских ИИ-чипов для обучения и дальнейшего обеспечения работы китайских ИИ-моделей. В частности, утверждалось, что при их создании использовалась интеллектуальная собственность американских компаний.

Дополнительно на днях сообщалось, что Соединённые Штаты готовят санкции против китайских производителей памяти CXMT, YMTC и других чипмейкеров.

Постоянный URL: https://servernews.kz/1123190
21.05.2025 [09:25], Сергей Карасёв

AMD представила процессоры Ryzen Threadripper PRO 9000 WX — до 96 ядер Zen 5 и 8 каналов DDR5-6400 ECC

Компания AMD анонсировала процессоры Ryzen Threadripper PRO 9000 WX и Ryzen Threadripper 9000 для высокопроизводительных рабочих станций, рассчитанных на создание и обучение ИИ-моделей, рендеринг графики, генерацию визуальных эффектов и другие ресурсоёмкие задачи.

Новые чипы, известные под кодовым названием Shimada Peak, основаны на микроархитектуре Zen 5. Изделия обеспечивают поддержку до 128 линий PCIe 5.0 (без CXL), а также восьми каналов памяти DDR5-6400 ECC. Обеспечивается совместимость с материнскими платами, оборудованными процессорным разъёмом Socket TR5.

 Источник изображений: AMD

Источник изображений: AMD

Семейство Ryzen Threadripper PRO 9000 WX включает шесть моделей, насчитывающих от 12 до 96 вычислительных ядер с поддержкой SMT2. Максимальная тактовая частота в Boost-режиме у всех этих процессоров достигает 5,4 ГГц, а показатель TDP равен 350 Вт. На вершине серии располагается чип Ryzen Threadripper 9995WX с 96 ядрами (192 потока) и кешем L3 объемом 384 Мбайт. AMD заявляет, что этот процессор обеспечивает прирост производительности на 10–20 % по сравнению с решением предыдущего поколения Ryzen Threadripper PRO 7995WX на архитектуре Zen 4 и почти на 220 % по сравнению с чипом Intel Xeon W9-3595X.

В свою очередь, семейство Ryzen Threadripper 9000 представлено тремя изделиями с 24, 32 и 64 ядрами (с поддержкой многопоточности), максимальной частотой 5,4 ГГц и TDP в 350 Вт. Объём кеша L3 равен 256 Мбайт у старшей версии и 128 Мбайт у двух других. Они предлагают лишь четыре канала памяти DDR5-6400 ECC и 88 линий PCIe 5.0.

Новые процессоры станут доступны в июле. Системы на их основе будут предлагаться такими производителями, как Dell, HP, Lenovo и Supermicro.

Постоянный URL: https://servernews.kz/1123185

Входит в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности»;

Система Orphus