Материалы по тегу: ии

19.05.2025 [13:05], Руслан Авдеев

Nebius построит в Израиле национальный суперкомпьютер с 4 тыс. ускорителей NVIDIA Blackwell за $140 млн

Облачный ИИ-провайдер Nebius (ранее Yandex N.V.) построит и будет управлять в Израиле национальным суперкомпьютером стоимостью $140 млн. Правительство выделит на строительство машины $45 млн — это уже второй этап реализации местного проекта National AI Program, сообщает Datacenter Dynamics.

По данным местных СМИ, суперкомпьютер будет иметь производительность 16 Эфлопс (точность вычислений не называется), а сама Nebius предложила местным властям льготные расценки. Первую очередь проекта введут в эксплуатацию в начале 2026 года. По данным документов тендеров, попавших в руки журналистам, Nebius развернёт 4 тыс. ускорителей NVIDIA Blackwell.

Google и Amazon (AWS), уже заключившие с израильскими властями договор об участии в военном облачном проекте Nimbus стоимостью $1,2 млрд. Изначально они тоже участвовали в тендере на создание суперкомпьютера, но позже отозвал заявки. Представители израильских властей заявили СМИ, что предложение Nebius было лучшим, при этом у сотрудников компании накоплены достаточные компетенции в строительстве аналогичных суперкомпьютеров.

 Источник изображения: SEO Galaxy/unspalsh.com

Источник изображения: SEO Galaxy/unspalsh.com

Nebius появилась только в прошлом году, когда часть «Яндекса» выделил европейский бизнес в отдельную компанию. Базирующаяся в Амстердаме Nebius управляет дата-центром в Финляндии, подразделением Nebius AI, а также компанией Toloka AI, провайдером образовательных технологий TripleTen и компанией Avride, занимающейся системами автономного вождения.

После привлечения $700 млн и «повторного» выхода на Nasdaq, компания наращивает мощность своих ЦОД. Nebius обязалась инвестировать более $1 млрд в ИИ-инфраструктуру в Европе к середине 2025 года. Инвестиции предусматривают утроение мощности дата-центра в Финляндии, расширение бизнеса в США и аренду объектов для ЦОД в Канзас-Сити (Kansas City). Кроме того, запланирована аренда у Verne в Исландии и внедрение ускорителей в Париже совместно с Equinix.

Постоянный URL: http://servernews.kz/1123051
19.05.2025 [11:36], Сергей Карасёв

LISA для Leonardo: итальянский суперкомпьютер получит ИИ-апгрейд за €28 млн

Европейское совместное предприятие по развитию высокопроизводительных вычислений (EuroHPC JU) сообщило о заключении контракта с компанией Eviden на выполнение модернизации итальянского суперкомпьютера Leonardo под решение ИИ-задач. Стоимость проекта под названием LISA (Leonardo Improved Supercomputing Architecture) оценивается более чем в €28 млн.

Комплекс Leonardo, запущенный в 2022 году, в текущей конфигурации использует платформы Atos BullSequana X2610 и X2135. В ноябрьском рейтинге TOP500 эта система занимает девятое место с теоретической пиковой производительностью 306,31 Пфлопс. Планируется интеграция Leonardo с квантовым компьютером IQM Radiance в конфигурации с 54 кубитами.

Модернизация LISA предполагает развёртывание 166 серверных узлов, каждый из которых будет оснащён восемью ИИ-ускорителями на базе GPU. По информации The Register, будут задействованы серверы семейства BullSequana AI 600 и изделия NVIDIA H100. Общее количество ускорителей в составе сегмента LISA — 1328. Говорится о применении интерконнекта Infiniband.

EuroHPC JU отмечает, что базовые узлы Leonardo и система LISA будут использовать единый многопротокольный уровень хранения, который обеспечивает возможность одновременной работы с блоками, файлами и объектами. При этом могут применяться службы данных, необходимые для поддержания ресурсоёмких вычислительных задач ИИ.

 Источник изображения: EuroHPC JU

Источник изображения: EuroHPC JU

Развёртывание LISA запланировано на конец текущего года, а суммарные затраты на проект составят €28 167 942. LISA станет первым вычислительным кластером EuroHPC, разработанным с нуля специально для нагрузок ИИ. Европейское совместное предприятие EuroHPC JU сейчас занято формированием сети ИИ-фабрик: в 2025 году такие площадки появятся в Финляндии, Германии, Греции, Италии, Люксембурге, Испании и Швеции.

Постоянный URL: http://servernews.kz/1123043
19.05.2025 [11:29], Сергей Карасёв

ИИ-облако TensorWave с ускорителями AMD получило ещё $100 млн, в том числе от самой AMD

Компания TensorWave, создающая облачную ИИ-платформу на ускорителях AMD, объявила о проведении раунда финансирования Series A, в ходе которого получено $100 млн. Инвестиционную программу возглавили Magnetar и AMD Ventures при участии Maverick Silicon, Nexus Venture Partners и Prosperity7.

В апреле 2024 года TensorWave начала развёртывание облачной ИИ-системы с ускорителями Instinct MI300X. Кроме того, внедряются решения Instinct MI325X. Платформа TensorWave предполагает применение прямого жидкостного охлаждения (DLC) и высокопроизводительного хранилища. Утверждается, что при решении определённых задач, таких как запуск крупных ИИ-моделей в FP16-формате, ускорители AMD обеспечивают преимущества перед изделиями NVIDIA благодаря большему объёму памяти. В результате, ускоряется внедрение сервисов и снижается стоимость услуг для заказчиков.

В конце прошлого года стартап TensorWave привлёк $43 млн на закупку ускорителей AMD. В раунде финансирования приняли участие Maverick Capital, Translink Capital, Javelin Venture Partners, Granite Partners и AMD Ventures. Новое финансирование в размере $100 млн по срокам совпало с развёртыванием 8192 ускорителей Instinct MI325X для ИИ-кластера в дата-центре в Тусоне (Аризона, США).

 Источник изображения: TensorWave

Источник изображения: TensorWave

Полученные средства, как ожидается, будут способствовать развитию бизнеса TensorWave, расширению штата и ускорению создания облачной платформы на базе Instinct MI325X. Рынок инфраструктуры ИИ переживает беспрецедентный рост: по оценкам, к 2027 году затраты в данном секторе превысят $400 млрд. Аналитическая фирма Fortune Business Insights подсчитала, что объём мирового рынка ИИ в целом в 2024 году достиг $233 млрд. Прогнозируется, что показатель увеличится примерно до $1,7 трлн долларов к 2032 году.

«Финансирование в размере $100 млн поддерживает миссию TensorWave по демократизации доступа к передовым вычислительным ресурсам. Кластер из 8192 ускорителей Instinct MI325X — это только начало», — сказал Даррик Хортон (Darrick Horton), генеральный директор TensorWave.

Постоянный URL: http://servernews.kz/1123042
19.05.2025 [11:24], Сергей Карасёв

Broadcom представила оптический CPO-интерконнект третьего поколения со скоростью 200G на линию

Компания Broadcom анонсировала платформу CPO (Co-Packaged Optics — интегрированная оптика) третьего поколения для создания оптического интерконнекта с высокой пропускной способностью. Решение ориентировано на инфраструктуры ИИ с большой нагрузкой и возможностью масштабирования.

Broadcom начала активное развитие направления CPO в 2021 году, анонсировав чипсет первого поколения Tomahawk 4-Humboldt. Затем последовало решение второго поколения Tomahawk 5-Bailly (TH5-Bailly) со скоростью передачи данных 100 Гбит/с на линию. В настоящее время организовано массовое производство таких продуктов. Они, как утверждается, обеспечивают бесшовную интеграцию оптических и электрических компонентов для повышения производительности при снижении энергопотребления.

Решения Broadcom CPO третьего поколения поддерживают оптические соединения с пропускной способностью 200 Гбит/с на линию. Интерконнект может применяться в инфраструктурах, насчитывающих более 512 узлов, которые предназначены для обучения крупных моделей ИИ и инференса. Технология, как отмечается, призвана решить проблемы пропускной способности, мощности и задержки, возникающие на фоне увеличения количества параметров ИИ-моделей.

 Источник изображения: Broadcom

Источник изображения: Broadcom

В число партнёров Broadcom по экосистеме CPO входят Corning Incorporated, Delta Electronics, Foxconn Interconnect Technology, Micas Networks и Twinstar Technologies. В частности, Delta Electronics организовала производство коммутаторов Ethernet TH5-Bailly 51.2T CPO в форм-факторе 3RU, которые доступны в конфигурациях с воздушным и жидкостным охлаждением. А Micas Networks предлагает сетевую коммутационную систему TH5-Bailly, обеспечивающую экономию электроэнергии более чем на 30 % по сравнению с решениями с традиционными подключаемыми модулями.

Вместе с тем Broadcom уже разрабатывает решения CPO четвёртого поколения, которые обеспечат пропускную способность до 400 Гбит/с на линию.

Постоянный URL: http://servernews.kz/1123045
19.05.2025 [08:49], Владимир Мироненко

На одном ИИ не выедешь: США рискуют потерять лидерство в HPC

Проблемы, связанные с высокопроизводительными вычислениями (HPC), угрожают инновациям в США, утверждает Джек Донгарра (Jack Dongarra), лауреат премии А. М. Тьюринга и один создателей рейтинга самых мощных суперкомпьютеров в мире TOP500, чьи разработки и реализации многих библиотек, включая EISPACK, LINPACK, BLAS, LAPACK и ScaLAPACK, сыграли важную роль в продвижении HPC. В статье, опубликованной The Conversation, Донгарра рассказал о прогрессе HPC и проблемах с инновациями в США.

Учёный отметил, что HPC являются одной из самых важных технологий в современном мире, позволяющей решать различные задачи — от прогнозирования погоды до поиска новых лекарств и обучения ИИ-моделей, которые слишком сложны или слишком велики для обычных компьютеров. Сейчас HPC находятся на переломном этапе, и выбор, который правительство США, исследователи и технологическая отрасль делают сегодня, может повлиять на будущее инноваций, национальной безопасности и мирового лидерства, предупреждает Донгарра.

Используя тысячи и даже миллионы чипов с передовыми системами памяти и хранения для быстрого перемещения и сохранения огромных объёмов данных, HPC-платформы позволять выполнять чрезвычайно подробные симуляции и вычисления, говорит Донгарра. Важность HPC ещё больше возросла с развитием ИИ-технологий, требующих огромных вычислительных мощностей для обучения. «В результате ИИ и HPC теперь тесно сотрудничают, подталкивая друг друга вперёд», — отметил учёный.

По словам Донгарра, сегмент HPC находится под большим давлением, чем когда-либо, с более высокими требованиями к системам по скорости, данным и энергопотреблению. Также он отметил, что HPC сталкиваются с некоторыми серьёзными техническими проблемами.

Донгарра назвал одной из ключевых проблем разрыв между производительностью чипов и подсистем памяти. «Представьте себе, что у вас есть сверхбыстрый автомобиль, но вы застряли в пробке — мощность бесполезна, если дорога не может с ней справиться», — говорит учёный. Точно так же подсистемы памяти не способны «прокормить» вычислительные блоки, которые простаивают, что отражается на эффективности всей вычислительной системы.

 Источник изображения: OLCF

Источник изображения: OLCF

Ещё одна проблема HPC — энергопотребление. Закон масштабирования Деннарда, согласно которому с уменьшением размеров транзистора уменьшается и энергопотребление при росте производительности, прекратил своё действие в 2006 году. Теперь, чем мощнее компьютеры, тем больше они потребляют энергии. Чтобы исправить это, исследователи ищут новые способы проектирования как аппаратного, так и программного обеспечения HPC.

Также существует проблема с типами производимых чипов, отметил учёный. Сейчас индустрия чипов в основном сосредоточена на ИИ, который отлично работает с вычислениями с низкой точностью. Однако для многих научных приложений по-прежнему требуется FP64-вычисления. В частности, NVIDIA сделала ставку исключительно на ИИ, поэтому FP64-производительность новейших GB300 почти в 30 раз меньше, чему GB200. У AMD, по слухам, в следующем поколении Instinct будет сразу два варианта ускорителей MI430X с поддержкой FP64 и MI450X, полностью лишённый тензорных ядер с FP64. Но и она может сделать ставку только на ИИ.

Если производители прекратят выпускать чипы, которые требуются учёным, это негативно отразится на выполнении важных исследований. Таким образом тенденции в производстве полупроводников и коммерческие приоритеты могут разниться с потребностями научного сообщества, а отсутствие специализированного оборудования может помешать прогрессу в исследованиях. Можно попытаться создавать специализированные чипы для HPC, но это дорого и сложно. Исследователи, тем не менее, изучают возможность применения новых конструкций для изготовления чипов, включая чиплеты, чтобы сделать их более доступными.

В прошлом у США было преимущество в области HPC благодаря государственному финансированию, поддержке и открытости разработок, но теперь многие страны вкладывают значительные средства в HPC в стремлении снизить зависимость от иностранных технологий и выйти на лидирующие позиции в таких областях, как моделирование климата и персонализированная медицина. В Европе развивают программу EuroHPC, у Япония есть собственный суперкомпьютер Fugaku (а скоро будет ещё один), а у Китая — целая серия «автохтонных» машин.

 Источник изображения: WIkipedia / DoE

Источник изображения: WIkipedia / DoE

Правительства стран понимают, что HPC являются ключом к их национальной безопасности, экономической мощи и научному лидерству, отметил Донгарра, подчеркнув, что у США всё ещё нет чёткого долгосрочного плана на будущее. Другие страны развивают это направление быстро, а без национальной стратегии США рискуют отстать, предупредил он: «Национальная стратегия США должна включать финансирование создания новых машин и обучение людей их использованию. Она также должна включать партнёрство с университетами, национальными лабораториями и частными компаниями. Самое главное, что план должен быть сосредоточен не только на оборудовании, но и на ПО и алгоритмах, которые делают HPC полезными», — заявил учёный.

Он отметил, что некоторые шаги в этом направлении уже предприняты, включая принятие в 2022 году «Закона о чипах и науке» (CHIPS and Science Act) и создание управления, которое поможет превратить научные исследования в реальные продукты. В 2025 году также была сформирована целевая группа Vision for American Science and Technology, призванная объединить некоммерческие организации, академические круги и промышленность для помощи правительству в принятии решений. Кроме того, получили развитие квантовые вычисления. Но они пока находятся на ранних стадиях и, скорее всего, будут дополнять, а не заменять традиционные HPC. Поэтому важно продолжать инвестировать в оба вида вычислений.

Донгарра назвал это правильными шагами, но они не решат проблему поддержки HPC в долгосрочной перспективе. Помимо краткосрочного финансирования и инвестиций в инфраструктуру, учёный предложил:

  • осуществлять долгосрочные федеральные инвестиции в НИОКР в области HPC, включая передовое оборудование, ПО и энергоэффективные архитектуры;
  • производить закупку и развёртывание передовых вычислительных систем в национальных лабораториях и университетах;
  • заниматься развитием кадров, включая обучение параллельному программированию, численным методам и интеграции ИИ-HPC;
  • согласовывать планы по выпуску оборудования, гарантируя, что разработка коммерческих чипов будет совпадать с потребностями научных и инженерных приложений;
  • использовать устойчивые модели финансирования, на которые не повлияют геополитические факторы;
  • стимулировать государственно-частное партнёрство для преодоления разрыва между академическими исследованиями, отраслевыми инновациями и потребностями национальной безопасности.

Донгарра отметил, что HPC — это больше, чем просто быстрые суперкомпьютеры. Это основа научных открытий, экономического роста и национальной безопасности. Если США примут предложенные меры, то можно гарантировать, что HPC продолжат поддерживать инновации в течение десятилетий.

Постоянный URL: http://servernews.kz/1123022
17.05.2025 [16:05], Сергей Карасёв

Autonomous представила рабочую станцию Brainy для ИИ-задач

Компания Autonomous анонсировала мощную рабочую станцию Brainy, ориентированную на задачи машинного обучения и нагрузки ИИ. Утверждается, что новинка подходит для работы с большими языковыми моделями (LLM), насчитывающими до 70 млрд параметров. При этом пользователи могут добиться значительной экономии средств по сравнению с арендой облачных GPU, говорит компания.

Рабочая станция предлагается в четырёх модификациях — Core, Pro, Pro Max и Ultra. Они несут на борту соответственно два, четыре, шесть и восемь ускорителей NVIDIA GeForce RTX 4090 Ada (16 384 ядра CUDA; 24 Гбайт GDDR6X с 384-бит шиной), а производительность ИИ на операциях FP32 достигает 330 Тфлопс, 661 Тфлопс, 991 Тфлопс и 1,32 Пфлопс.

Младшая модель Brainy Core располагает процессором AMD Ryzen Threadripper 3960X (24C/48T; 3,8–4,5 ГГц), 64 Гбайт системной памяти, одним блоком питания мощностью 1650 Вт, загрузочным SSD вместимостью 1 Тбайт, а также сетевым контроллером 1GbE. Стоит такая версия $9000.

 Источник изображений: Autonomous

Источник изображений: Autonomous

Ступенью выше располагается модификация Brainy Pro, за которой идёт Brainy Pro Max: они предлагаются по цене $19 000 и $25 000. Обе снабжены чипом Ryzen Threadripper Pro 5955WX (16C/32T; 4,0–4,5 ГГц), 128 Гбайт оперативной памяти, SSD на 1 Тбайт, двухпортовым сетевым адаптером 10GbE, контроллером ВМС и двумя блоками питания мощностью 1650 Вт.

Самая мощная версия рабочей станции — Brainy Ultra — обойдётся в $40 000. Она укомплектована процессором AMD EPYC 9124 Genoa (16C/32C; 3,0–3,7 ГГц), 192 Гбайт ОЗУ, SSD ёмкостью 1 Тбайт, контроллером Aspeed AST 2500, двухпортовым сетевым адаптером 10GbE и четырьмя блоками питания мощностью 2000 Вт каждый. 

При этом все конфигурации не выглядят достаточно сбалансированными. Например, у Pro Max системной памяти меньше, чем VRAM, но хотя бы остаются свободные линии PCIe для подключения накопителей с данными. Кроме того, RTX 4090 не имеет поддержки NVLink Bridge, так что каждая карта работает независимо.

Постоянный URL: http://servernews.kz/1122994
16.05.2025 [18:25], Руслан Авдеев

Обойдёмся без Microsoft: OpenAI заключила сделку с CoreWeave на $4 млрд

Компания CoreWeave заключила очередную сделку с OpenAI на сумму $4 млрд до 2029 года. По данным Bloomberg, в недавнем финансовом отчёте компания отчиталась о новом соглашении «с крупным предприятием в сфере ИИ», но имя партнёра не называлось. Ранее компании OpenAI уже подписала с CoreWeave сделку на $11,9 млрд, предусматривающую использование вычислительных мощностей последней. Эта сделка не вошла в перечень текущих обязательств CoreWeave (RPO).

Партнёрство двух компаний поможет CoreWeave диверсифицировать клиентскую базу, а OpenAI — сократить зависимость от Microsoft, а также собственного ИИ-проекта Stargate с участием SoftBank и Oracle. Впрочем, дело несколько сложнее, потому что якорным заказчиком CoreWeave, обеспечивающим 62 % выручки, была сама Microsoft, которая арендовала ресурсы в интересах OpenAI. Вторым по величине клиентом была NVIDIA. Ходили слухи, что в Microsoft намерены сократить расходы, но в CoreWeave информацию опровергали — ранее речь шла о контракте стоимостью $10 млрд.

Ранее эксклюзивным поставщиком облачных сервисов для OpenAI была Microsoft, вложившая в компанию с 2019 года $19 млрд, но в 2024 году было объявлено, что OpenAI будет работать и с Oracle, правда, при посредничестве той же Microsoft. По данным Datacenter Dynamics, после анонса Stargate компании «выяснили отношения» и Microsoft получила почётное звание «ключевого первоначального технологического партнёра», но не получила доли в бизнесе в отличие от Oracle, SoftBank и арабской MGX. Microsoft подтвердила, что партнёрство более не является эксклюзивным, хотя у компании остаётся право «преимущественного выбора» (ROFR).

 Источник изображения: SEO Galaxy/unsplash.com

Источник изображения: SEO Galaxy/unsplash.com

В начале мая The Financial Times заявляла, что условия сотрудничества пересматриваются, а основные разговоры ведутся о том, какую долю должна получить в капитале OpenAI компания Microsoft в обмен на прошлые инвестиции. Источники заявляют также и о пересмотре условий контракта, заключённого компаниями ещё в 2019 году. По имеющимся данным, Microsoft готова отказаться от части доли в будущей коммерческой компании в обмен на доступ передовым к технологиям OpenAI, разработанным после 2030 года, когда текущий контракт закончится.

Как сообщают некоторые источники, во многом проблема связана с «высокомерием» OpenAI, желающей денег, но также требующей не вмешиваться в рабочие процессы — Microsoft якобы должна радоваться самому факту такого сотрудничества. Впрочем, по словам близкого к OpenAI источника, Microsoft по-прежнему заинтересована в превращении последней в коммерческую структуру, хотя впереди предстоят сложные переговоры.

Постоянный URL: http://servernews.kz/1122965
16.05.2025 [16:54], Анжелла Марина

США готовят санкции против китайских производителей памяти CXMT, YMTC и других чипмейкеров

Администрация США рассматривает возможность включения нескольких китайских компаний по производству чипов в «чёрный список» экспортного контроля. Среди них — производитель памяти CXMT, а также дочерние структуры крупнейших китайских чипмейкеров SMIC и YMTC. Такое положение дел ограничит для этих компаний доступ к американским технологиям, поскольку поставки без специальной лицензии станут невозможны.

Решение пока не принято из-за разногласий внутри администрации. Часть чиновников считает, что санкции могут сорвать переговоры по торговой сделке между США и Китаем, которые недавно договорились о временном снижении пошлин на 90 дней. Однако другие, как пишет Financial Times, настаивают на жёстких мерах, напоминая, что республиканцы критиковали предыдущую администрацию за слишком мягкую политику в отношении КНР.

Особое внимание США привлекает компания CXMT, которая активно наращивает долю на мировом рынке чипов памяти DRAM и разрабатывает высокопроизводительную память HBM, критически важную для ИИ-нагрузок. В Вашингтоне опасаются, что передовые технологии могут быть использованы Китаем для модернизации военного потенциала, включая разработку гиперзвукового оружия и моделирование ядерных испытаний.

 Источник изображения: cxmt.com

Источник изображения: cxmt.com

Если компании попадут в «чёрный список», это станет очередным шагом США по ограничению доступа Китая к передовым полупроводниковым технологиям, а американские компании не смогут поставлять им оборудование и компоненты без сложного процесса согласования. Ранее аналогичные меры уже применялись против SMIC и YMTC.

Китайские компании пока не прокомментировали ситуацию. В посольстве КНР в США заявили, что «решительно выступают против злоупотребления Вашингтоном концепцией национальной безопасности и искусственных ограничений в торговле», назвав такие действия попыткой подавить технологическое развитие Китая.

Белый дом и Министерство торговли США отказались от официальных комментариев. Однако эксперты считают, что решение может быть принято в ближайшие недели, что увеличит напряжённость в американо-китайских отношениях.

Постоянный URL: http://servernews.kz/1122967
16.05.2025 [14:45], Руслан Авдеев

США готовы разрешить ОАЭ импортировать миллионы ускорителей NVIDIA для постройки одного из крупнейших в мире ИИ ЦОД

США заключили с ОАЭ предварительное соглашение, разрешающее последним импортировать 500 тыс. самых современных ИИ-ускорителей NVIDIA ежегодно. По словам двух источников Reuters, поставки начнутся уже в этом году, что ускорить строительство Эмиратами ИИ ЦОД. По оценкам, это позволит создать в Абу-Даби один из крупнейших в мире ИИ-кампусов площадью 25,9 км2 и мощностью 5 ГВт.

По словам источников, соглашение о поставке ускорителей должно действовать как минимум до 2027 года, но не исключено, что срок его действия продлят и до 2030-го. Проект предусматривает поставку пятой части всех чипов (около 100 тыс. штук в год) компании G42, а остальные разделят между американскими компаниями, работающими в сфере ИИ, вроде Microsoft (которая сама связана с G42) и Oracle. Не исключено, что последняя будет строить в ОАЭ дата-центры.

Соглашение ещё может измениться — по некоторым данным, оно находится на стадии обсуждения и оппозиция ему имеется даже в самом правительстве США. Предыдущая администрация США подготовила ограничения на поставки передовых ИИ-ускорителей в большую часть стран мира — отчасти для того, чтобы не допустить их перепродажу в Китай. Новая администрация отменила столь жёсткие ограничения, вредящие американскому бизнесу.

 Источник изображения: Darcey Beau/unspalsh.com

Источник изображения: Darcey Beau/unspalsh.com

Турне нынешнего президента США по странам Персидского залива уже привело к заключения сделок с организациями Саудовской Аравии на сумму $600 млрд. На сегодня большинство вычислительных ИИ-мощностей в мире развёрнуты в США и Китае, но если все предлагаемые в регионе Персидского залива сделки увенчаются успехом, он может стать третьим «центром силы» для ИИ-вычислений в мире.

Долями в G42 владеют Фонд национального благосостояния Абу-Даби Mubadala, правящая семья ОАЭ и американская частная инвестиционная компания Silver Lake, а её председателем является советник по национальной безопасности ОАЭ и брат президента ОАЭ шейх Тахнун ибн Шахбут Аль Нахайян (Tahnoon bin Zayed Al Nahyan). В числе прочего предварительное соглашение направлено на продвижение ЦОД в США. Пока в нём указано, что для каждого объекта, построенного G42 в ОАЭ, компания обязуется построить аналогичный ЦОД в США.

По словам одного из источников, что именно будет называться «передовым» ИИ-чипом, будет решать отдельная рабочая группа, которую создадут позже, вместе с разработкой условий обеспечения безопасности. По словам одного из источников, речь идёт о новейших чипах NVIDIA поколения Blackwell. Также не исключается, что предусмотрены поставки чипов NVIDIA Rubin, которые производительнее тех и других и ещё не появились в продаже.

Постоянный URL: http://servernews.kz/1122943
16.05.2025 [14:13], Руслан Авдеев

Tencent санкциями не напугать: китайский IT-гигант накопил достаточно ИИ-ускорителей для обучения моделей в течение многих лет

Китайский IT-гигант Tencent уверен, что накопил достаточно высокопроизводительных ускорителей для обучения новых ИИ-моделей в течение многих лет. Отчасти это объясняют тем, что в КНР нашли более эффективные способы работы с ИИ-нагрузками, чем в США, сообщает The Register.

В ходе подведения финансовых итогов I квартала 2025 года президент Tencent Мартин Лау (Martin Lau), объявил, что у компании «довольно большой запас чипов», которые компания успела приобрести до новых ограничений со стороны Соединённых Штатов. Часть будет использоваться для приложений, которые принесут «немедленную прибыль» — вроде рекламных и рекомендательных систем. Часть пойдёт на обучение ещё нескольких поколений LLM с использованием передовых методов, позволяющих использовать минимально возможное количество ускорителей.

Сообщается, что в последние месяцы в КНР стали отходить от американской концепции «масштабирования», согласно которой обучающий кластер надо постоянно увеличивать — хороших результатов можно добиться и без этого, в том числе на этапе пост-обучения. По словам Лау, агентный и рассуждающий ИИ требуют больше ускорителей сам по себе, но оптимизация ПО поможет ещё больше повысить эффективность инференса. Поэтому Tencent намерена вкладываться в повышение эффективности использования доступных ресурсов — например, обучение более мелких моделей для более узких задач, требующих меньше мощностей.

 Источник изображения: chen zy/unsplash.com

Источник изображения: chen zy/unsplash.com

Как заявил Лау, компания рассматривает и альтернативы недоступным более ускорителям NVIDIA. Потенциально компания может использовать и другие ускорители и аппаратные решения, включая ASIC-модули и даже обычные GPU в некоторых случаях, в том числе для более мелких моделей. Высказывания Лау предполагают, что попытки США заблокировать экспорт высокопроизводительных ускорителей в Китай не принесли ожидавшихся результатов — вместо этого Tencent добилась прогресса в оптимизации и инновациях.

Несколько противоречат оптимистичным заявлениям Лау высказывания генерального директора Tencent Пони Ма (Pony Ma), который подчеркнул, что облачный бизнес фактически подразумевает перепродажу мощностей ускорителей, поэтому сейчас для компании, на фоне дефицита, это направление стало менее приоритетным. Другими словами, дефицит всё же имеется.

В любом случае на данный момент компания находится в превосходном состоянии. За I квартал выручка выросла на 13 % год к году до $25,1 млрд, а валовая прибыль — на 20 % до $14 млрд. Компания насчитывает 1,4 млрд активных пользователей Weixin и WeChat ежемесячно, а новая рекламная платформа на базе ИИ только улучшает показатели. Компания является не только рекламным посредником, но и активно занимается стримингом видео и аудио, а доходы от её игр в последнее время резко выросли.

 Источник изображения: Donald Wu/unsplash.com

Источник изображения: Donald Wu/unsplash.com

Пока торговая война между США и Китаем смешала планы многих бизнесов, но Лау предлагает подождать и посмотреть на результаты в следующем квартале. По его словам, правительство оказывает большую поддержку, что компенсирует новые высокие тарифы.

В своё время китайский стартап DeepSeek сумел доказать, что в мире ИИ можно добиться больших результатов относительно малыми средствами. Хотя позже выяснилось, что экономичность его моделей не так высока, как утверждалось, американское технологическое превосходство всё равно было поставлено под вопрос.

Постоянный URL: http://servernews.kz/1122932
Система Orphus