Материалы по тегу: nvidia

17.05.2025 [16:05], Сергей Карасёв

Autonomous представила рабочую станцию Brainy для ИИ-задач

Компания Autonomous анонсировала мощную рабочую станцию Brainy, ориентированную на задачи машинного обучения и нагрузки ИИ. Утверждается, что новинка подходит для работы с большими языковыми моделями (LLM), насчитывающими до 70 млрд параметров. При этом пользователи могут добиться значительной экономии средств по сравнению с арендой облачных GPU, говорит компания.

Рабочая станция предлагается в четырёх модификациях — Core, Pro, Pro Max и Ultra. Они несут на борту соответственно два, четыре, шесть и восемь ускорителей NVIDIA GeForce RTX 4090 Ada (16 384 ядра CUDA; 24 Гбайт GDDR6X с 384-бит шиной), а производительность ИИ на операциях FP32 достигает 330 Тфлопс, 661 Тфлопс, 991 Тфлопс и 1,32 Пфлопс.

Младшая модель Brainy Core располагает процессором AMD Ryzen Threadripper 3960X (24C/48T; 3,8–4,5 ГГц), 64 Гбайт системной памяти, одним блоком питания мощностью 1650 Вт, загрузочным SSD вместимостью 1 Тбайт, а также сетевым контроллером 1GbE. Стоит такая версия $9000.

Источник изображений: Autonomous

Ступенью выше располагается модификация Brainy Pro, за которой идёт Brainy Pro Max: они предлагаются по цене $19 000 и $25 000. Обе снабжены чипом Ryzen Threadripper Pro 5955WX (16C/32T; 4,0–4,5 ГГц), 128 Гбайт оперативной памяти, SSD на 1 Тбайт, двухпортовым сетевым адаптером 10GbE, контроллером ВМС и двумя блоками питания мощностью 1650 Вт.

Самая мощная версия рабочей станции — Brainy Ultra — обойдётся в $40 000. Она укомплектована процессором AMD EPYC 9124 Genoa (16C/32C; 3,0–3,7 ГГц), 192 Гбайт ОЗУ, SSD ёмкостью 1 Тбайт, контроллером Aspeed AST 2500, двухпортовым сетевым адаптером 10GbE и четырьмя блоками питания мощностью 2000 Вт каждый. 

При этом все конфигурации не выглядят достаточно сбалансированными. Например, у Pro Max системной памяти меньше, чем VRAM, но хотя бы остаются свободные линии PCIe для подключения накопителей с данными. Кроме того, RTX 4090 не имеет поддержки NVLink Bridge, так что каждая карта работает независимо.

Постоянный URL: http://servernews.kz/1122994

16.05.2025 [14:45], Руслан Авдеев

США готовы разрешить ОАЭ импортировать миллионы ускорителей NVIDIA для постройки одного из крупнейших в мире ИИ ЦОД

США заключили с ОАЭ предварительное соглашение, разрешающее последним импортировать 500 тыс. самых современных ИИ-ускорителей NVIDIA ежегодно. По словам двух источников Reuters, поставки начнутся уже в этом году, что ускорить строительство Эмиратами ИИ ЦОД. По оценкам, это позволит создать в Абу-Даби один из крупнейших в мире ИИ-кампусов площадью 25,9 км² и мощностью 5 ГВт.

По словам источников, соглашение о поставке ускорителей должно действовать как минимум до 2027 года, но не исключено, что срок его действия продлят и до 2030-го. Проект предусматривает поставку пятой части всех чипов (около 100 тыс. штук в год) компании G42, а остальные разделят между американскими компаниями, работающими в сфере ИИ, вроде Microsoft (которая сама связана с G42) и Oracle. Не исключено, что последняя будет строить в ОАЭ дата-центры.

Соглашение ещё может измениться — по некоторым данным, оно находится на стадии обсуждения и оппозиция ему имеется даже в самом правительстве США. Предыдущая администрация США подготовила ограничения на поставки передовых ИИ-ускорителей в большую часть стран мира — отчасти для того, чтобы не допустить их перепродажу в Китай. Новая администрация отменила столь жёсткие ограничения, вредящие американскому бизнесу.

Источник изображения: Darcey Beau/unspalsh.com

Турне нынешнего президента США по странам Персидского залива уже привело к заключения сделок с организациями Саудовской Аравии на сумму $600 млрд. На сегодня большинство вычислительных ИИ-мощностей в мире развёрнуты в США и Китае, но если все предлагаемые в регионе Персидского залива сделки увенчаются успехом, он может стать третьим «центром силы» для ИИ-вычислений в мире.

Долями в G42 владеют Фонд национального благосостояния Абу-Даби Mubadala, правящая семья ОАЭ и американская частная инвестиционная компания Silver Lake, а её председателем является советник по национальной безопасности ОАЭ и брат президента ОАЭ шейх Тахнун ибн Шахбут Аль Нахайян (Tahnoon bin Zayed Al Nahyan). В числе прочего предварительное соглашение направлено на продвижение ЦОД в США. Пока в нём указано, что для каждого объекта, построенного G42 в ОАЭ, компания обязуется построить аналогичный ЦОД в США.

По словам одного из источников, что именно будет называться «передовым» ИИ-чипом, будет решать отдельная рабочая группа, которую создадут позже, вместе с разработкой условий обеспечения безопасности. По словам одного из источников, речь идёт о новейших чипах NVIDIA поколения Blackwell. Также не исключается, что предусмотрены поставки чипов NVIDIA Rubin, которые производительнее тех и других и ещё не появились в продаже.

Постоянный URL: http://servernews.kz/1122943

16.05.2025 [14:13], Руслан Авдеев

Tencent санкциями не напугать: китайский IT-гигант накопил достаточно ИИ-ускорителей для обучения моделей в течение многих лет

Китайский IT-гигант Tencent уверен, что накопил достаточно высокопроизводительных ускорителей для обучения новых ИИ-моделей в течение многих лет. Отчасти это объясняют тем, что в КНР нашли более эффективные способы работы с ИИ-нагрузками, чем в США, сообщает The Register.

В ходе подведения финансовых итогов I квартала 2025 года президент Tencent Мартин Лау (Martin Lau), объявил, что у компании «довольно большой запас чипов», которые компания успела приобрести до новых ограничений со стороны Соединённых Штатов. Часть будет использоваться для приложений, которые принесут «немедленную прибыль» — вроде рекламных и рекомендательных систем. Часть пойдёт на обучение ещё нескольких поколений LLM с использованием передовых методов, позволяющих использовать минимально возможное количество ускорителей.

Сообщается, что в последние месяцы в КНР стали отходить от американской концепции «масштабирования», согласно которой обучающий кластер надо постоянно увеличивать — хороших результатов можно добиться и без этого, в том числе на этапе пост-обучения. По словам Лау, агентный и рассуждающий ИИ требуют больше ускорителей сам по себе, но оптимизация ПО поможет ещё больше повысить эффективность инференса. Поэтому Tencent намерена вкладываться в повышение эффективности использования доступных ресурсов — например, обучение более мелких моделей для более узких задач, требующих меньше мощностей.

Источник изображения: chen zy/unsplash.com

Как заявил Лау, компания рассматривает и альтернативы недоступным более ускорителям NVIDIA. Потенциально компания может использовать и другие ускорители и аппаратные решения, включая ASIC-модули и даже обычные GPU в некоторых случаях, в том числе для более мелких моделей. Высказывания Лау предполагают, что попытки США заблокировать экспорт высокопроизводительных ускорителей в Китай не принесли ожидавшихся результатов — вместо этого Tencent добилась прогресса в оптимизации и инновациях.

Несколько противоречат оптимистичным заявлениям Лау высказывания генерального директора Tencent Пони Ма (Pony Ma), который подчеркнул, что облачный бизнес фактически подразумевает перепродажу мощностей ускорителей, поэтому сейчас для компании, на фоне дефицита, это направление стало менее приоритетным. Другими словами, дефицит всё же имеется.

В любом случае на данный момент компания находится в превосходном состоянии. За I квартал выручка выросла на 13 % год к году до $25,1 млрд, а валовая прибыль — на 20 % до $14 млрд. Компания насчитывает 1,4 млрд активных пользователей Weixin и WeChat ежемесячно, а новая рекламная платформа на базе ИИ только улучшает показатели. Компания является не только рекламным посредником, но и активно занимается стримингом видео и аудио, а доходы от её игр в последнее время резко выросли.

Источник изображения: Donald Wu/unsplash.com

Пока торговая война между США и Китаем смешала планы многих бизнесов, но Лау предлагает подождать и посмотреть на результаты в следующем квартале. По его словам, правительство оказывает большую поддержку, что компенсирует новые высокие тарифы.

В своё время китайский стартап DeepSeek сумел доказать, что в мире ИИ можно добиться больших результатов относительно малыми средствами. Хотя позже выяснилось, что экономичность его моделей не так высока, как утверждалось, американское технологическое превосходство всё равно было поставлено под вопрос.

Постоянный URL: http://servernews.kz/1122932

14.05.2025 [00:23], Владимир Мироненко

Саудовская Аравия всерьёз намерена стать лидером в ИИ: госстартап Humain договорился о многомиллиардном партнёрстве с NVIDIA, AMD и AWS

Наследный принц Саудовской Аравии Мухаммед ибн Салман аль-Сауд (Mohammed bin Salman Al Saud) основал новую компанию Humain по разработке ИИ-технологий, пишет Reuters. Развитие этого направления является одним из приоритетов при трансформации экономики страны в соответствии с целями программы «Видение – 2030» (Vision 2030), призванной снизить её зависимость от добычи ископаемого топлива.

На сегодняшней встрече Мухаммеда ибн Салмана с президентом США Дональдом Трампом (Donald Trump), находящимся с четырёхдневным визитом в регионе, которая прошла при участии миллиардера Илона Маска (Elon Musk), а также на совместном саудовско-американском инвестиционном форуме в Эр-Рияде, ИИ был одной из центральных тем повестки дня.

Humain возглавляет сам наследный принц в качестве председателя. Гендиректором назначен Тарек Амин (Tareq Amin). Компания принадлежит Суверенному фонду Саудовской Аравии, взявшему на себя обязательство вложить значительные средства в развитие ИИ-технологий в стране. Как пишет Bloomberg со ссылкой на агентство Saudi Press Agency, новая компания займётся запуском ЦОД, развертыванием ИИ-инфраструктуры и облачных сервисов, а также разработкой больших языковых моделей (LLM) с поддержкой арабского языка.

Источник изображения: Akil Imran/unsplash.com

Компания намерена создать полностью готовую интегрированную ИИ-платформу для решения практических задач. В заявлении компании также указано, что она станет ИИ-центром для таких секторов, как энергетика, здравоохранение, производство и финансовые услуги страны. Поможет ей в этом целый ряд американских технологических компаний. В частности, было объявлено о сотрудничестве с NVIDIA, в рамках которого компании «будут использовать платформы и опыт NVIDIA, чтобы сделать Саудовскую Аравию мировым лидером в области ИИ, облачных GPU-вычислений и цифровой трансформации для стимулирования инноваций и роста во всем мире».

В течение следующих пяти лет Humain произведёт крупные инвестиции в строительство ИИ-фабрик в Саудовской Аравии мощностью до 500 МВт, использующих сотни тысяч передовых ускорителей NVIDIA. На первом этапе будет установлено 18 тыс. суперускорителей NVIDIA GB300 с интерконнектом NVIDIA InfiniBand. Эти ИИ ЦОД предоставят надёжную базовую инфраструктуру для обучения и развёртывания суверенных ИИ-моделей, что позволит Саудовской Аравии и другим странам ускорить инновации и цифровую трансформацию, отмечено в пресс-релизе.

Сообщается, что Humain также развернёт платформу NVIDIA Omniverse, что позволит таким отраслям, как производство, логистика и энергетика, создавать полностью интегрированные цифровые двойники, повышая эффективность, безопасность и устойчивость производств, а также ускоряя движение страны к «Индустрии 4.0».

Источник изображения: NVIDIA

Также было объявлено о партнёрстве Humain с AMD, в рамках которого будет инвестировано в течение пяти лет до $10 млрд в развертывание в стране ИИ-инфраструктуры мощностью 500 МВт. «Вместе мы создаём глобально значимую ИИ-платформу, которая обеспечивает производительность, открытость и охват на беспрецедентном уровне», — заявила генеральный директор AMD Лиза Су (Lisa Su). Предполагается, что часть мощностей будет введена в эксплуатацию в 2026 году. Humain будет предоставлять услуги клиентам, а AMD — поставлять чипы и ПО.

Также Humain подписала соглашение о сотрудничестве с AWS с целью реализации проекта по созданию «Зоны ИИ» (AI Zone) в Саудовской Аравии стоимостью $5 млрд, пишет TechCrunch. Зона будет включать специализированную ИИ-инфраструктуру AWS, серверы, сети. Упомянуты и программы обучения и сертификации. Humain сообщила о планах разрабатывать решения в области ИИ с использованием технологий AWS и работать с AWS над предоставлением доступа к инструментам и ПО для ИИ-стартапов из Саудовской Аравии.

Саудовская Аравия обязала компании и ИИ-сервисы хранить данные на территории королевства, стимулируя провайдеров размещать свои объекты в стране, чтобы не потерять имеющиеся контракты. В частности, Google и Oracle объявили о планах по расширению присутствия в регионе. Ранее страна ообъявила о $14,9 млрд инвестиций в ИИ-сектор.

Постоянный URL: http://servernews.kz/1122761

13.05.2025 [13:53], Сергей Карасёв

Анонсирован настольный ИИ-суперкомпьютер MSI EdgeXpert MS-C931 на базе NVIDIA DGX Spark

Компания MSI анонсировала устройство EdgeXpert MS-C931 — так называемый ИИ-суперкомпьютер в «настольном» формате. В основу решения положена платформа NVIDIA DGX Spark.

Компьютер заключён в корпус с габаритами 151 × 151 × 52 мм, а масса составляет около 1,2 кг. Задействован суперчип Grace Blackwell GB10, который объединяет ускоритель Blackwell и процессор Grace с 20 ядрами Arm в виде связки 10 × Arm Cortex-X925 и 10 × Arm Cortex-A725. Производительность достигает 1000 TOPS на операциях FP4. Питается новинка от внешнего БП мощностью около 240 Вт.

В оснащение EdgeXpert MS-C931 входят 128 Гбайт памяти LPDDR5x, M.2 NVMe SSD вместимостью до 4 Тбайт, контроллеры Wi-Fi 7 и Bluetooth 5.3, сетевой адаптер NVIDIA ConnectX-7 SmartNIC. Разъёмы сосредоточены в тыльной части: это четыре порта USB 3.2 Type-С (до 20 Гбит/с), гнездо RJ45 (10GbE), интерфейс HDMI 2.1a, а также два порта для объединения нескольких устройств в кластер.

Источник изображения: MSI

Используется программная платформа NVIDIA DGX OS — модификации Ubuntu, адаптированной для работы с ИИ. Утверждается, что устройство может использоваться для решения таких задач, как настройка ИИ-моделей, насчитывающих до 70 млрд параметров, инференс, тестирование приложений ИИ и пр. Кроме того, EdgeXpert MS-C931 подходит для использования на периферии — например, в составе систем машинного зрения или робототехнических комплексов. Среди основных категорий пользователей названы разработчики, специалисты в области данных и исследователи в сфере ИИ.

Постоянный URL: http://servernews.kz/1122702

10.05.2025 [09:45], Руслан Авдеев

NVIDIA ослабит и без того урезанные ускорители H20, чтобы вернуть возможность поставок в Китай

NVIDIA планирует представить искусственно ухудшенные версии ИИ-ускорителей H20 для Китая в ближайшие пару месяцев. Это позволит обойти экспортные ограничения, введённые в отношении исходной модели, сообщает Reuters со ссылкой на три источника, знакомых с вопросом.

По информации двух из них, американский производитель чипов уведомил ключевых китайских покупателей, включая ведущих облачных провайдеров, что намерен представить модифицированную версию H20 в июле. Это последняя из попыток NVIDIA сохранить присутствие на китайском рынке, являющемся для компании одним из ключевых — при этом официальный Вашингтон всеми силами стремится ограничить доступ Поднебесной к передовым полупроводниковым технологиям.

До недавнего времени H20 были самыми производительными ИИ-чипами, допущенными американскими властями к продаже в Китай, но в прошлом месяце компанию уведомили, что на их поставки в страну потребуется специальная экспортная лицензия, что фактически означает запрет массовых продаж. Правда, многие компании из КНР успели сделать большие запасы H20.

Источник изображения: NVIDIA

NVIDIA уже подготовила новое техническое задание на новую версию чипов. В результате H20 будут значительно ослаблены, в частности, по словам одного из источников, новинкам уменьшат ёмкость памяти. Правда, один из источников сказал, что потребители смогут перенастраивать модули для изменения производительности чипа. В самой NVIDIA новость не комментируют, как и в Министерстве торговли США.

В минувшем фискальном году, закончившемся 26 января, на рынок Китая приходилось $17 млрд или 13 % общей выручки NVIDIA, а в прошлом году глава компании Дженсен Хуанг (Jensen Huang) лично засвидетельствовал важность китайского рынка, нанеся в страну визит — всего через несколько дней после того, как американские власти анонсировали новые торговые ограничения, касавшиеся поставок H20. В ходе встреч с китайскими чиновниками он подчеркнул важность рынка страны для компании.

Стоит отметить, что это не первое искусственное ухудшение чипов, инициированное американскими властями. Ранее NVIDIA пришлось представить модели A800 и H800 вместо A100 и H100, а позже, в октябре 2023 года их тоже посчитали слишком производительными и появилась модель H20. На фоне роста спроса на ИИ-решения ключевые китайские IT-гиганты вроде Tencent, Alibaba и ByteDance нарастили закупки для использования эффективных ИИ-моделей компаний вроде DeepSeek.

По данным Reuters, с января NVIDIA получила заказы на H20 на сумму $18 млрд. Впрочем, в марте сообщалось, что H20 не соответствуют новым китайским требованиям к энергоэффективности ИИ-ускорителей и местные бизнесы негласно вынуждают применять отечественные, китайские решения вроде Ascend 910B. Для Huawei это шанс закрепиться на рынке, компания уже готовит ускорители Ascend 910D и 920.

Постоянный URL: http://servernews.kz/1122595

08.05.2025 [19:22], Сергей Карасёв

Cadence представила суперкомпьютер Millennium M2000 на базе NVIDIA Blackwell

Компания Cadence анонсировала суперкомпьютер Millennium M2000, спроектированный для выполнения сложного моделирования с использованием ИИ. Новая НРС-система предназначена для ускорения проектирования микрочипов, разработки лекарственных препаратов следующего поколения и пр.

Суперкомпьютер построен на платформе NVIDIA HGX B200. Кроме того, задействованы карты NVIDIA RTX Pro 6000 Blackwell Server Edition, оснащённые 96 Гбайт памяти GDDR7. Применены библиотеки NVIDIA CUDA-X и специализированное ПО для решения ресурсоёмких задач.

Утверждается, что Millennium M2000 обеспечивает до 80 раз более высокую производительность по сравнению с системами на базе CPU в области автоматизации проектирования электроники (EDA), создания и анализа систем (SDA) и разработки медикаментов. При этом глубоко оптимизированный программно-аппаратный стек помогает существенно сократить общее энергопотребление.

В качестве примера приводится моделирование подсистемы питания на уровне полупроводниковых чипов. В случае вычислительных комплексов на основе сотен традиционных CPU на выполнение такой задачи может потребоваться около двух недель. Суперкомпьютер Millennium M2000 позволит получить результат менее чем за один день.

Источник изображения: Cadence

Генеральный директор NVIDIA Дженсен Хуанг (Jensen Huang) сообщил, что компания планирует приобрести десять суперкомпьютерных систем Millennium на базе GB200 NVL72 для ускорения проектирования собственных продуктов. Сторонние заказчики смогут получить доступ к Millennium M2000 через облако или купить устройство для установки в собственном дата-центре. Базовая конфигурация включает около 32 ускорителей и стоит $2 млн, но это не финальная цена.

Постоянный URL: http://servernews.kz/1122489

29.04.2025 [14:44], Сергей Карасёв

Oracle развернула в облаке суперускорители NVIDIA GB200 NVL72

Корпорация Oracle ввела в эксплуатацию в своих дата-центрах первые суперускорители NVIDIA GB200 NVL72. Тысячи GPU семейства Blackwell доступны клиентам через облако NVIDIA DGX Cloud и инфраструктуру Oracle Cloud Infrastructure (OCI) для создания и запуска ИИ-агентов и «рассуждающих» моделей следующего поколения.

Решение GB200 NVL72 объединяет 18 узлов 1U в одной стойке: каждый из них содержит два ускорителя GB200, что в сумме даёт 72 чипа B200 и 36 процессоров Grace. Задействована система жидкостного охлаждения. Платформа Oracle включает высокоскоростные сетевые решения NVIDIA Quantum-2 InfiniBand и Spectrum-X Ethernet.

Отмечается, что Oracle планирует сформировать один из самых крупных в мире кластеров с ИИ-ускорителями поколения Blackwell. Системы OCI Supercluster смогут масштабироваться до более чем 100 тыс. GPU для удовлетворения стремительно растущих потребностей в вычислительных ресурсах для задач инференса и НРС. При этом Oracle предлагает гибкие варианты развёртывания, позволяющие клиентам использовать Blackwell через публичные, государственные и суверенные облака, а также собственные дата-центры.

Источник изображения: NVIDIA

О намерении задействовать мощности OCI GB200 уже заявили ряд крупных клиентов. В их число входят технологические компании, корпоративные заказчики, государственные учреждения, а также региональные поставщики облачных услуг.

Ранее о запуске общедоступных инстансов на основе NVIDIA GB200 NVL72 объявила компания CoreWeave, предоставляющая облачные сервисы для ИИ-задач. Кластеры Supermicro на базе NVIDIA GB200 NVL72 предложит клиентам Eviden (подразделение Atos Group). Эти суперускорители также взяла на вооружение облачная платформа Google Cloud. xAI также приступил к монтажу NVIDIA GB200 NVL72 для ИИ-кластера Colossus.

Постоянный URL: http://servernews.kz/1122018

28.04.2025 [14:48], Сергей Карасёв

ИИ-суперкомпьютер в чемодане — GigaIO Gryf обеспечит производительность до 30 Тфлопс

Компания GigaIO объявила о доступности системы Gryf — так называемого ИИ-суперкомпьютера в чемодане, разработанного в сотрудничестве с SourceCode. Это сравнительно компактное устройство, как утверждается, обеспечивает производительность ЦОД-класса для периферийных развёртываний.

Первая информация о Gryf появилась около года назад. Устройство выполнено в корпусе с габаритами 228,6 × 355,6 × 622,3 мм, а масса составляет примерно 25 кг. Система может эксплуатироваться при температурах от +10 до +32 °C.

Конструкция предусматривает использование модулей Sled четырёх типов: это вычислительный узел Compute Sled, блок ускорителя Accelerator Sled, узел хранения Storage Sled и сетевой блок Network Sled. Доступны различные конфигурации, но суммарное количество модулей Sled в составе Gryf не превышает шести. Плюс к этому в любой комплектации устанавливается модуль питания с двумя блоками мощностью 2500 Вт.

Узел Compute Sled содержит процессор AMD EPYC 7003 Milan с 16, 32 или 64 ядрами, до 512 Гбайт DDR4, системный SSD формата M.2 (NVMe) вместимостью 512 Гбайт и два порта 100GbE QSFP56. Блок Storage Sled объединяет восемь накопителей NVMe SSD E1.L суммарной вместимостью до 492 Тбайт. Модуль Network Sled предоставляет два порта QSFP28 100GbE и шесть портов SFP28 25GbE.

За ИИ-производительность отвечает модуль Accelerator Sled, который может нести на борту ускоритель NVIDIA L40S (48 Гбайт), H100 NVL (94 Гбайт) или H200 NVL (141 Гбайт). В максимальной конфигурации быстродействие в режиме FP64 достигает 30 Тфлопс (3,34 Пфлопс FP8), а пропускная способность памяти — 4,8 Тбайт/с.

Источник изображения: GigaIO

Архитектура новинки обеспечивает возможность масштабирования путём объединения в единый комплекс до пяти экземпляров Gryf: в общей сложности можно совместить до 30 модулей Sled в той или иной конфигурации. Заказы на Gryf уже поступили со стороны Министерства обороны США, американских разведывательных структур и пр.

Постоянный URL: http://servernews.kz/1121963

24.04.2025 [00:15], Владимир Мироненко

Китайские IT-гиганты всё-таки успели закупить NVIDIA H20 на миллиарды долларов до объявления новых санкций

Ведущие интернет-компании Китая, включая ByteDance, Alibaba и Tencent, успели сделать запасы урезанных ИИ-ускорителей NVIDIA H20 на миллиарды долларов, прежде чем США прекратили поставки чипов в апреле, сообщил ресурс Nikkei Asia со ссылкой на источники в отрасли. По словам источников, эти компании ещё в прошлом году начали готовиться к тому, что Вашингтон может ограничить и их поставки.

Один из источников сообщил, что эти компании обратились к NVIDIA с просьбой поставить в общей сложности около 1 млн ускорителей H20 — примерно годовой запас — как можно скорее, в идеале к концу мая. Он добавил, что по факту было поставлено меньше из-за того, что администрация Трампа объявила о необходимости лицензирования поставок этих чипов в начале апреля. Ещё один источник утверждает, что стоимость срочных заказов превысила $12 млрд, и что NVDIA успела отгрузить чипов на несколько миллиардов долларов до того, как вступили в силу новые требования.

Согласно источникам, ByteDance была одной из самых активных в скупке чипов, стремясь приобрести их как можно больше. На активность компаний повлиял резкий роста спроса на ИИ-мощности в Китае, особенно после громкого дебюта DeepSeek в начале этого года. В феврале Tencent начала интегрировать DeepSeek в свою платформу WeChat с аудиторией более 1,2 млрд пользователей, что значительно увеличило требования к вычислительным ресурсам. Топ-менеджер компании сообщил, что ограничения на поставки H20 не стали неожиданностью, поскольку их уже ожидали в отрасли. «Каждая крупная китайская технологическая компания заранее запасалась H20», — отметил он.

Источник изображения: Jan Kopřiva / Unsplash

Помимо размещения срочных заказов на поставку передовых чипов, китайские компании производили закупки чипов NVIDIA за пределами Китая, где они не подпадают под экспортный контроль США, сообщили источники Nikkei Asia. Также для доступа к ИИ-ускорителям китайские игроки прибегали к созданию дочерних компаний или филиалов за рубежом или заключали соглашения о сотрудничестве с отраслевыми партнёрами, такими как операторы связи.

«Они знали, что это произойдет, и были готовы к этому дню. Они сказали нам, что их агрессивная цель построить больше ЦОД в этом году остается неизменной», — рассказал топ-менеджер поставщика компаний ByteDance и Alibaba Cloud. Помимо материкового Китая и Гонконга, Alibaba управляет ЦОД в 13 странах, включая два в США, в то время как у ByteDance есть ЦОД в странах Юго-Восточной Азии и Европы, включая Ирландию и Норвегию.

Между тем, китайские провайдеры ЦОД ускоряют процесс валидации ИИ-чипов местного производства, таких как Ascend от Huawei, говорят источники. В начале апреля Huawei представила собственный суперускоритель CloudMatrix 384 на базе 384 ускорителей Huawei Ascend 910C в качестве альтернативы NVIDIA GB200 NVL72. H20 — это дважды ослабленная версия NVIDIA H100. H20 имеет примерно одну десятую вычислительной мощности H100 для обучения ИИ и всего 20 % от его возможностей по инференсу. Тем не менее, он очень популярен в Китае.

Источник изображения: Joshua Wordel / Unsplash

Специалист по ИИ из Гонконга Юджин Ли (Eugene Lee) сообщил, что конфигурация H20 оптимизирована для инференса, в отличие от высокопроизводительных возможностей обучения чипов H100 и H800. Если поставки H20 закончатся, его можно будет частично заменить отечественными альтернативами или облачными решениями для моделей малого и среднего размера. Вместе с тем развёртывание и постоянная оптимизация больших ИИ-моделей могут быть существенно ограничены.

Ли отметил, что обучение многих мощных ИИ-моделей обеспечивается ранее закупленными H100 и H800, а основные поставщики облачных услуг также используют их для инференса. «Если существующие запасы H100 и H800 будут исчерпаны, это может серьёзно затруднить обучение передовых моделей и разработку систем следующего поколения, что создаст существенную угрозу конкурентоспособности Китая в разработке высокопроизводительного ИИ», — сказал эксперт.

NVIDIA предупредила, что экспортные ограничения на H20 пойдут на пользу её конкурентам. 15 апреля компания заявила, что ущерб от этого за квартал составит около $5,5 млрд. В минувшем финансовом году, который закончился 26 января, на Китай пришлось около 13,1 % от общего дохода NVIDIA, тогда как годом ранее этот показатель составлял почти 17 %. Доля Сингапура, напротив, выросла до 18 % с 11,2 % в предыдущем году. Впрочем, NVIDIA отметила, что эти цифры группируются по месту выставления счетов клиентам, и многие клиенты используют Сингапур для централизации расчётов и поставок чипов в другие места. По фактическим поставкам Сингапур принёс NVIDIA менее 2 % от общего дохода за этот период.

Постоянный URL: http://servernews.kz/1121760