Материалы по тегу: ии
31.03.2025 [10:49], Руслан Авдеев
Новые нормы энергоэффективности ИИ-ускорителей угрожают бизнесу NVIDIA в КитаеПекин представил новые нормы энергоэффективности для ИИ-ускорителей. Весьма вероятно, что они помешают китайским компаниям приобретать наиболее востребованные в Китае ускорители NVIDIA, если регуляторы всерьёз возьмутся за контроль их исполнения, сообщает The Financial Times. Национальная комиссия по развитию и реформам (NDRC) настоятельно рекомендует местным игрокам рынка ЦОД использовать ускорители, соответствующие требованиям к энергоэффективности, при строительстве новых дата-центров и расширении уже существующих объектов. Популярный в Китае ИИ-ускоритель NVIDIA H20 менее производителен, чем флагманские модели компании, но его можно официально поставлять в страну. Однако, по данным издания, на сегодняшний день H20 не соответствует новым требованиям комиссии. По информации источников, в последние несколько месяцев китайский регулятор без лишнего шума «отговаривает» местные IT-гиганты, такие как Alibaba, ByteDance и Tencent, от использования H20. Впрочем, пока правила применяются не слишком жёстко, и эти ускорители NVIDIA по-прежнему востребованы на китайском рынке. Последствия для бизнеса NVIDIA могут оказаться серьёзнее, если комиссия решит ужесточить запрет — это поставит под угрозу многомиллиардные доходы компании в Китае. Несмотря на активное строительство дата-центров, американский разработчик рискует потерять заказы, а его место займёт Huawei, чьи продукты лучше соответствуют новым «зелёным» требованиям. В настоящее время NVIDIA ищет способы повысить энергоэффективность своих решений и стремится провести переговоры с руководством NDRC для обсуждения сложившейся ситуации. Однако это приведёт к снижению производительности H20 и, соответственно, конкурентоспособности на китайском рынке. ![]() Источник изображения: Henry Chen/unsplash.com Поскольку ограничения распространяются главным образом на новые, строящиеся ЦОД, некоторые компании обходят правила, заменяя в уже действующих дата-центрах старые ускорители на H20. В других случаях несоблюдение норм может привести к проверкам и штрафам. Хотя ограничения вступили в силу ещё в прошлом году, до недавнего времени о них не сообщалось — Китай всеми силами стремится к технологическому суверенитету в полупроводниковой сфере и активно содействует отказу местных компаний от продукции NVIDIA. Прямым конкурентом H20 считается Huawei Ascend 910B, на подходе и вариант 910C. NRDC недвусмысленно намекает на будущее отношений Пекина и NVIDIA. После ужесточения экспортных ограничений США в отношении Китая в октябре 2023 года компания специально разработала ослабленную экспортную версию H20. Однако на фоне триумфа китайских ИИ-моделей стартапа DeepSeek в стране разразился настоящий бум ИИ-технологий, и компании вроде Alibaba и Tencent активно закупают H20, особенно с учётом вероятного дальнейшего ужесточения американских санкций, включая возможный запрет на поставки даже ослабленных ускорителей. Китай — четвёртый по величине рынок для NVIDIA в мире: в 2025 фискальном году выручка компании здесь составила $17,1 млрд, или 13 % от всех продаж. Помимо Huawei, конкуренцию NVIDIA на китайском рынке может составить и Intel с её ускорителями HL328 и HL388, однако они также не соответствуют новым китайским требованиям по энергоэффективности. Впрочем, их доля в китайском импорте изначально была незначительной.
29.03.2025 [10:11], Алексей Степин
Bolt Graphics анонсировала универсальную видеокарту со слотами SO-DIMM, которая может потягаться с RTX 5080Все современные графические ускорители предлагаются с жёстко заданным при производстве объёмом видеопамяти, а в наиболее производительных моделях память типа HBM вообще интегрирована на одной с основным кристаллом подложке. Однако требования к объёму памяти в последнее время растут быстрее, а за дополнительный объём вендор просят всё больше. Кардинально иной подход предлагает компания Bolt Graphics, недавно анонсировавшая серию ускорителей Zeus. Несмотря на «ИИ-пандемию», Bolt Graphics в своём анонсе не делает упор на искусственный интеллект, а называет Zeus первым GPU, специально созданным для целей HPC, рендеринга, трассировки лучей и даже компьютерных игр. Что интересно, в основе Zeus лежит не некая закрытая архитектура: скалярная часть нового GPU построена на базе спецификации RISC-V RVA23, векторная представлена FP64 ALU на базе несколько модифицированной RVV 1.0. Прочие функции реализованы путём кастомных расширений и отдельных блоков-ускорителей. Все они пользуются общим кешем объёмом 128 Мбайт. Дополняет картину блок телеметрии и внутренний интерконнект для общения с другими вычислительным блоками. Используется чиплетный подход. Базовый «строительный блок» Zeus 1c26-032 включает GPU-чиплет, который соединён с 32 Гбайт набортной памяти LPDDR5x (273 Гбайт/с) и контроллером внешней памяти DDR5 (90 Гбайт/с), т.е. при желании можно установить ещё 128 Гбайт RAM (два модуля SO-DIMM). В GPU-чиплет встроены контроллеры DisplayPort 2.1a и HDMI 2.1b, а с внешним миром он общается посредством IO-чиплета, с которым он соединён 256-Гбайт/с каналом. IO-чиплет предлагает необычный набор портов. Помимо сразу двух интерфейсов PCIe 5.0 x16 (64 Гбайт/с каждый) имеется выделенный порт RJ-45 для BMC и 400GbE-порт QSFP-DD. Наконец, есть аппаратный блок видеокодирования, способный справиться с двумя потоками 8K@60 AV1/H.264/H.265. Заявленный уровень производительности в векторных FP64/FP32/FP16-вычислениях составляет 5/10/20 Тфлопс, а в матричных INT16/INT8 — 307,2/614,4 Топс. Аппаратный блок ускорения лучей (path tracing) выдаёт до 77 гигалучей. Для сравнения: NVIDIA RTX 5090 способна выдавать 32 гигалуча, а FP64-производительность составляет 1,6 Тфлопс. В то же время в расчётах пониженной точности актуальные решения NVIDIA всё равно быстрее Zeus 1c26-032. Однако у новинки есть важное преимущество — её уровень TDP составляет всего 120 Вт. Второй интерфейс PCIe 5.0 x16 можно использовать для прямого объединения двух карт. Вариант ускорителя с двумя чиплетами носит название Zeus 2c26-064/128, а с четырьмя — 4c26-256. Последние числа обозначают объём распаянной памяти LPDDR5X. Что касается расширяемой памяти, то количество доступных разъёмов SO-DIMM также зависит от модели и составляет до восьми, так что во флагманской конфигурации базовые 256 Гбайт LPDDR5x можно дополнить аж 2 Тбайт DDR5. Производительность с увеличением количеств GPU-чиплетов растёт практически пропорционально, но есть некоторые другие нюансы. Так, в Zeus 2c26-064 и Zeus 2c26-128 (оба варианта имеют TDP 250 Вт) есть только один IO-чиплет, а GPU-чиплеты объединены шиной со скоростью 768-Гбайт. Zeus 4c26-256 имеет сразу четыре I/O чиплета в составе, которые дают восемь контроллеров PCIe 5.0 x4 (один чиплет, совокупно 32 линии) и шесть 800GbE-портов OSFP (три чиплета). Между собой GPU-чиплеты объединены шиной со скоростью 512-Гбайт/с. Каждый из них соединён с собственным IO-чиплетом на скорости 256 Гбайт/с. Теплопакет флагмана составляет 500 Ватт, ускоритель, если верить Bolt Graphnics, развивает 20 Тфлопс в режиме FP64, почти 2500 Топс на вычислениях FP8 и способен обрабатывать до 307 гигалучей. Разработчики явно заложили в своё детище широкие возможности кластеризации, о чём свидетельствует наличие мощной сетевой подсистемы. Поддерживаются как скромные конфигурации из двух GPU, соединённых непосредственно по Ethernet 400GbE, так и масштабные системы уровня стойки, содержащей 80 плат Zeus 4c26-256, соединённых как с коммутатором, так и напрямую друг с другом. Такой кластер потребляет 44 кВт, но зато способен обеспечивать запуск крупных физических симуляций или обучение ИИ моделей за счёт огромного массива общей памяти, составляющего 160 Тбайт. Вычислительная производительность такого кластера достигает 1,6 Пфлопс в режиме FP64 и 196 Попс в режиме FP8. Одной из особенностей новинок является трассировщик лучей Glowstick, способный работать в режиме реального времени практически во всех современных пакетах 3D-моделирования или видеоредактирования, таких как Maya, 3ds Max, Blender, SketchUp, Houdini и Nuke. Он будет дополнен фирменной библиотекой Bolt MaterialX, содержащей более 5000 текстур высокого качества. А благодаря поддержке стандарта OpenUSD он сможет легко интегрироваться в любую цепочку рендеринга и пост-обработки. Также запланирован электромагнитный симулятор Bolt Apollo. Обещаны фирменные драйверы Vulkan/DirectX и SDK с использованием LLVM. Ранний доступ к комплектам разработчика Bolt Graphics наметила на IV квартал текущего года. В III квартале 2026 года должны появиться 2U-серверы на базе Zeus, а массовые поставки серверов и PCIe-карт начнутся не ранее IV квартала того же года. Пока сложно сказать, насколько хорошо новая архитектура себя проявит, но если верить предварительным тестам Zeus, выигрыш в сравнении с существующими ускорителями существенен, особенно в энергопотреблении.
29.03.2025 [10:01], Сергей Карасёв
Квартальные затраты на облачную инфраструктуру выросли вдвое на фоне бума ИИПо оценкам компании International Data Corporation (IDC), мировые затраты на облачную инфраструктуру в IV квартале 2024 года достигли $67 млрд: это на 99,3 %, т.е. практически в два раза, больше по сравнению с аналогичным периодом предыдущего года. При этом необлачный сегмент показал рост на 25,8 % — до $22 млрд. Аналитики учитывают продажи серверов и СХД для выделенных и публичных облачных платформ. Главным драйвером отрасли является ИИ, в частности, «рассуждающие» модели и агенты ИИ. Облачные провайдеры активно закупают дорогостоящие системы с ускорителями на базе GPU, а также инвестируют средства в расширение сетей дата-центров. Расходы на публичную облачную инфраструктуру достигли $57 млрд в IV квартале 2024 года, увеличившись на 124,4 % по сравнению с предыдущим годом. В секторе выделенных облаков отмечен рост на 21,8 % в годовом исчислении — до $10 млрд. Таким образом, на публичные платформы пришлось 64,0 % от общих затрат. В географическом разрезе расходы на облачную инфраструктуру в последней четверти 2024 года увеличились во всех регионах. В частности, максимальный рост зафиксирован в Канаде и США — плюс 151,8 % и 125,3 % в годовом исчислении соответственно. Китай, Япония, Азиатско-Тихоокеанский регион (за исключением КНР и Японии), Западная Европа, Ближний Восток / Африка, а также Латинская Америка показали прибавку в 99,6 %, 76,2 %, 48,0 %, 36,8 %, 28,1 % и 14,3 % соответственно. В Центральной и Восточной Европе отмечено увеличение на 5,6 %. IDC прогнозирует, что в 2025 году расходы на облачную инфраструктуру поднимутся на 33,3 % по сравнению с 2024-м, составив $271,5 млрд. При этом публичные платформы покажут рост на 25,7 % в годовом исчислении — до $213,7 млрд. В сегменте выделенных облаков ожидается прибавка около 71,8 % — до $57,8 млрд. Расходы на необлачную инфраструктуру, по мнению IDC, в 2025 году снизятся на 4,9 %, составив $68,1 млрд.
28.03.2025 [18:01], Руслан Авдеев
Crusoe привлекла $225 млн на закупку чипов NVIDIA для развития облачной ИИ-инфраструктурыКомпания Crusoe получила кредитную линию в объёме $225 млн для расширения своего облака. Раунд возглавила частная кредитная структура Upper90 Capital Management, а участвовали в сборе средств British Columbia Investment Management Corporation, FS Investments, King Street Capital Management, Liberty Mutual Investments и ORIX USA, сообщает Datacenter Dynamics. Более всего Crusoe сегодня известна строительством дата-центров, также компания управляет облачным сервисом, доступным корпоративным клиентам, желающим арендовать ИИ-инфраструктуру. Привлечённые средства потратят на приобретение ИИ-ускорителей NVIDIA и вспомогательной инфраструктуры для расширения облаков оператора. В компании заявляют, что новые средства будут способствовать расширению облака Crusoe Cloud, призванного упростить и ускорить разработку ИИ для каждой компании-клиента. Давнее стратегическое партнёрство с Upper90 сыграло важную роль в масштабировании технологий Crusoe для удовлетворения спроса на облака. По данным пресс-службы Crusoe, последний раунд финансирования развивает успехи компании, достигнутые после декабрьского раунда серии D на сумму $600 млн. ![]() Источники изображения: Alexander Grey/unsplash.com В своё время компания начинала как бизнес, занимавшийся добычей криптовалют и размещала модульные ЦОД неподалёку от нефтегазовой инфраструктуры для использования в качестве топлива для генераторов попутного природного газа. В последние годы она переключилась на работу с ИИ-инфраструктурой и строит большой ЦОД в Техасе совместно с Oracle для OpenAI, намеренной реализовать проект Stargate. Также сообщалось о совместном проекте с Chirisa и PowerHouse стоимостью $5 млрд, предусматривающем строительство ЦОД на этой территории США, в основном для CoreWeave. Наконец, совсем недавно она объявила о полном отказе от своего криптомайнингового бизнеса — оставшиеся активы проданы NYDIG. Ранее сообщалось, что Crusoe получит доступ к 4,5 ГВт электричества, вырабатываться которое будет за счёт природного газа. Проект реализован совместно с инвесторами из Engine No.1. Предполагается использовать мощности для питания новых ИИ ЦОД, некоторые из которых, возможно, построят для Stargate. Для Crusoe Cloud арендовано помещение ЦОД ICE02 в Исландии, партнёрское соглашение заключили и с Digital Realty. Стоит отметить, что Upper90 была одним из первых спонсоров Crusoe, кредит на оборудование компания предоставила последней ещё в 2019 году. В Upper90 подчеркнули, что Crusoe сегодня находится на переднем крае облачных ИИ-вычислений и решений в области экоустойчивой энергетики. Представители инвестора заявили, что заняты структурированием инновационного финансирования и гордятся углублением связей с Crusoe.
28.03.2025 [11:17], Сергей Карасёв
NVIDIA близка к приобретению облачного ИИ-провайдера Lepton AIКомпания NVIDIA, по сообщению The Information, ведёт переговоры о покупке облачного стартапа Lepton AI, который специализируется на сдаче в аренду ИИ-серверов. Стоимость сделки, как утверждается, может составить «сотни миллионов долларов». Фирма Lepton AI была основана в 2023 году: её соучредителями являются Янцин Цзя (Yangqing Jia) и Цзюньцзе Бай (Junjie Bai), бывшие исследователи лаборатории искусственного интеллекта Meta✴ Platforms. Они, в частности, принимали участие в разработке PyTorch. ![]() Источник изображения: NVIDIA Lepton AI предоставляет облачные ресурсы, оптимизированные для различных задач ИИ, включая обучение больших языковых моделей (LLM) и инференс. Клиентам доступны разные ускорители NVIDIA, а также специальный инструмент для централизованного управления выделенными мощностями при работе одновременно с несколькими проектами. Платформа Lepton AI содержит функции для обнаружения возможных ошибок на этапе обучения LLM и всевозможных проблем технического характера, например, связанных с выделением памяти. После завершения разработки ИИ-модели клиенты могут развернуть её в облаке Lepton AI с применением инстансов, оптимизированных для задач инференса. Говорится о производительности более 600 токенов в секунду при задержках менее 10 мс. Отмечается, что Lepton AI в ходе начального раунда финансирования получила $11 млн. В число инвесторов входят CRV и Fusion Fund. На сегодняшний день штат стартапа насчитывает около 20 сотрудников. Ожидается, что приобретение Lepton AI поможет NVIDIA укрепить позиции в сегменте облачных вычислений для ИИ.
27.03.2025 [11:29], Руслан Авдеев
Microsoft отказалась от проектов ЦОД общей ёмкостью 2 ГВтКомпания Microsoft отказалась от некоторых проектов дата-центров в США и Европе совокупной мощностью около 2 ГВт. Об этом сообщает Bloomberg со ссылкой на аналитику TD Cowen, связывающую подобные изменения с «перепроизводством» ИИ-кластеров. Примечательно, что в феврале сообщалось о том, что Microsoft отказалась от аренды ЦОД на «пару сотен мегаватт». Последние изменения могут быть также связаны с отказом Microsoft от некоторых совместных проектов с OpenAI, хотя на этот ИИ-стартап техногигант уже потратил $13 млрд. Не так давно компании сообщили, что изменили соглашение о многолетнем сотрудничестве, что позволило OpenAI использовать облачные сервисы сторонних компаний. Очевидно, что Microsoft сама не желала или не могла развивать сотрудничество. ![]() Источник изображения: Bermix Studio/unsplash.com По данным TD Cowen, в последние полгода оптимизация бизнеса Microsoft заключалась в том числе в отказе от арендных обязательств и отложенных проектах. По мнению аналитиков, Google и Meta✴ воспользовались этим для получения дополнительных ёмкостей ЦОД в Европе. Не исключено что отказ связан с невозможностью объектов разместить самые современные ускорители. Так, грядущее поколение суперускорителей NVIDIA Rubin Ultra NVL576 потребует уже 600 кВт на стойку. В самой Microsoft заявляют, что в текущем финансовом году на строительство ЦОД будет потрачено $80 млрд. Год заканчивается в июне, но после этого рост соответствующего бизнеса компании начнёт замедляться. Как считают в руководстве компании, после стремительного расширения инфрасруктуры для поддержки OpenAI и прочих ИИ-проектов, теперь вместо новых строек средства будут тратиться на дооснащение серверами и оборудованием уже существующих объектов. Ранее на этой неделе Джо Цай (Joe Tsai) предупредил о потенциальном образовании «пузыря» на рынке строительства ЦОД, заявив, что новые проекты могут привести к «перепроизводству» мощностей, превышающему спрос на ИИ-серверы. В TD Cowen также уверены, что отмена и отсрочка аренды мощностей в дата-центрах указывает на их переизбыток из-за более низкого спроса, чем прогнозировалось.
27.03.2025 [09:19], Сергей Карасёв
Siemens купила поставщика ПО для промышленного моделирования Altair за $10 млрдНемецкий концерн Siemens объявил о завершении сделки по покупке американской компании Altair Engineering, которая поставляет ПО и облачные решения для промышленного моделирования, интернета вещей (IoT), приложений ИИ и HPC, а также для анализа данных. О сделке было объявлено в конце октября 2024 года. По условиям соглашения, акционеры Altair получат $113 за каждую ценную бумагу, что соответствует премии в размере 19 % к стоимости акций на 21 октября — последний день до появления в СМИ информации о слиянии. Таким образом, общая сумма сделки составила $10 млрд. Благодаря приобретению Altair концерн Siemens рассчитывает укрепить позиции в области промышленного ПО, включая решения на основе ИИ. Немецкая компания намерена расширить возможности платформ для механического и электромагнитного моделирования, высокопроизводительных вычислений, создания цифровых двойников и пр. Утверждается, что все клиенты Siemens — от инженеров до специалистов широкого профиля — получат доступ к новым экспертным знаниям в области моделирования. Это позволит ускорить инновации и цифровую трансформацию компаний всех размеров. Приобретение Altair является частью масштабной инициативы Siemens ONE Tech Company, которая направлена на улучшение эффективности, увеличение прибыли и повышение удовлетворённости клиентов. Ожидается, что сделка значительно увеличит выручку Siemens от цифрового бизнеса, обеспечив прибавку на уровне 8 %. Программа Siemens ONE Tech Company также предполагает инвестиции в НИОКР в таких областях, как передовое ПО, системы с поддержкой ИИ, подключённое оборудование и пр.
26.03.2025 [12:22], Руслан Авдеев
Выход Cerebras на IPO откладывается из-за нехватки чиновников и подозрениях в тайных связях с Китаем ключевого инвестора компанииАмериканский производитель ИИ-ускорителей Cerebras Systems вынужден отложить выход на биржу. IPO задерживается, поскольку компания пока не получила одобрение со стороны одного из американских регуляторов — Комитета по иностранным инвестициям в США (CFIUS), сообщает Reuters. По информации издания, ссылающегося на пять независимых анонимных источников, руководство Cerebras ждёт завершения рассмотрения заявки, а также назначения новых ключевых чиновников. Без разрешения регулятора IPO невозможно, поскольку среди инвесторов — компания G42 из Абу-Даби (ОАЭ), специализирующаяся на облачных технологиях и ИИ. Ранее американские власти уже уделяли внимание этому инвестору из-за его предполагаемых связей с китайским бизнесом. Cerebras неоднократно заявляла, что её решения не просто превосходят по многим характеристикам ускорители NVIDIA, но и являются более экономически эффективными. Впрочем, именно это сыграло против неё. Технологии Cerebras и их значение для национальной безопасности США стали причиной того, что процесс IPO оказался под вопросом или, как минимум, в центре пристального внимания регуляторов. Главной причиной задержки называется отсутствие действующего помощника министра финансов США по вопросам инвестиционной безопасности, который обычно курирует работу CFIUS. Хотя у сотрудников организации есть определённые полномочия для принятия решений, сделку с G42 сочли «политически рискованной». Источники Reuters предполагают, что чиновники решили не торопиться, дожидаясь назначения человека, готового взять на себя ответственность за окончательное решение. Ранее ожидалось, что инвестициям G42 дадут зелёный свет ещё до конца 2024 года, хотя IPO было решено отложить. ![]() Источник изображения: Cerebras В преддверии возможных сложностей Cerebras и G42 заранее внесли поправки в документы для CFIUS, подчеркнув, что G42 получит лишь акции без права голоса. В теории это должно было упростить одобрение сделки. Однако проблема не решилась: в сентябре 2024 года стороны запросили отмену рассмотрения заявки, но окончательное решение в CFIUS пока так и не вынесли. Как сообщает Silicon Angle, ситуацию усугубляет инициатива администрации нового президента США Дональда Трампа (Donald Trump), активно поддерживаемая Илоном Маском (Elon Musk), по сокращению государственных расходов. В рамках нового плана численность сотрудников различных ведомств, включая CFIUS, уменьшится, что замедлит процесс рассмотрения заявок на сделки. Однако, хотя нынешняя оппозиция пытается возложить ответственность на новую администрацию, G42 стала «проблемным» партнёром намного. Так, в апреле 2024 года Microsoft вложила в G42 средства в объёме $1,5 млрд, из-за чего у властей возник ряд вопросов, касающихся возможных связей арабской компании с Китаем. Пока неизвестно, сколько времени потребуется для урегулирования ситуации, но в Cerebras уверены, что сделку в конечном счёте одобрят и компания возобновит подготовку к выходу на IPO.
26.03.2025 [11:13], Руслан Авдеев
Руководитель Alibaba предупредил о перегреве рынка ИИ ЦОДПредседатель Alibaba Group Джо Цай (Joe Tsai) предупредил, что дата-центров для ИИ может быть построено больше, чем необходимо. В ходе недавнего мероприятия HSBC Global Investment Summit в Гонконге он заявил, что текущие темпы строительства ЦОД могут опередить рост спроса на ИИ-сервисы, сообщает Bloomberg. По данным издания, бизнесмен заявил, что «начинает видеть пузырь некоего вида». Он отметил, что некоторые проекты строительства уже стартовали без заключения предварительных соглашений с будущими клиентами, без гарантированного спроса. Цай выразил озабоченность тем, что ЦОД строятся «наудачу», по инициативе появившихся в отрасли людей и фондов, с привлечением миллионов или даже миллиардов долларов. В частности, он обратил внимание на практику строительства дата-центров в США. Инвестиционные обязательства в соответствующем секторе страны уже весьма значительны. В этом году стартовал проект Stargate с участием OpenAI, Oracle и SoftBank, в рамках которого компании собираются потратить до $500 млрд, в основном на строительство ИИ ЦОД на всей территории США. Как сообщает Datacenter Dynamics, другие компании также планируют масштабные вложения в строительство ИИ-инфраструктуры в 2025 году. Так, Microsoft обещала потратить $80 млрд (хотя уже отказалась от 2 ГВт), Amazon (AWS) — $100 млрд, Google — $75 млрд, а Meta✴ — $60–65 млрд. ![]() Источник изображения: Ben Allan/unsplash.com По словам Цая, он всё ещё поражён уровнем инвестиций в ИИ в США. Бизнесмен прямо заявил, что люди буквально говорят о $500 млрд — совершенно избыточной сумме. Бизнесмен считает, что люди, возможно, напрасно вкладывают деньги, рассчитывая на значительный рост спроса в будущем. Убеждённость в том, что ИИ-проекты представляют собой большой «мыльный пузырь», у некоторых экспертов существует уже давно, но усугубилась она к январю 2025 года, на фоне появления экономичных и эффективных ИИ-моделей китайского стартапа DeepSeek, сумевшего обучить модель R1 за весьма скромные деньги (хотя сенсационность новости несколько преувеличена). После новостей о триумфе китайских ИИ-технологий сегмент фондового рынка США, связанный с искусственным интеллектом, стремительно потерял около $1 трлн, $600 млрд из которых приходилось на акции NVIDIA. В текущем месяце Alibaba представила ИИ-модель QwQ-32B на 32 млрд параметров, которая, как утверждается, соответствует по производительности DeepSeek-R1, но требует ещё меньше вычислительных ресурсов. После этого китайская Tencent объявила, что замедлит развёртывание ускорителей, хотя её капитальные расходы всё ещё будут составлять более 10 % от выручки. В финансовом 2024 году та составляла $91,1 млрд, на 8 % выше год к году. Несмотря на слова Цая и более осмотрительный подход конкурентов к инвестициям, ранее в этом году Alibaba Group объявила, что намерена потратить на облачную и ИИ-инфраструктуру $52 млрд в следующие три года — это высочайший уровень инвестиций для компании к сегодняшнему дню.
26.03.2025 [01:00], Владимир Мироненко
NVIDIA поделится с MediaTek фирменным интерконнектом NVLink для создания кастомных ASICMediaTek объявила о планах расширить сотрудничество с NVIDIA, интегрировав NVLink в разрабатываемые ей ASIC, сообщил ресурс DigiTimes. В свою очередь, ресурс smbom.com пишет, что партнёры намерены совместно разрабатывать передовые решения с использованием NVLink и 224G SerDes. Аналитики предполагают, что выход NVIDIA в сектор ASIC позволит ей ускорить дальнейшее продвижение на рынке с использованием опыта MediaTek и при этом решать имеющиеся проблемы. Как ожидают аналитики, по мере развития сотрудничества двух компаний всё больше провайдеров облачных услуг будет проявлять интерес к работе с MediaTek. Внедрение NVLink в ASIC MediaTek может значительно повысить привлекательность сетевых решений NVIDIA. Объединив усилия, NVIDIA и MediaTek смогут предложить комплексную разработку кастомных ASIC, которая будет включать поддержку HBM4e, обширную библиотеку IP-блоков, передовые процессы производства и упаковки. MediaTek отдельно подчеркнула, что её SerDes-блоки является ключевым преимуществом при разработке ASIC. Компании расширяют сотрудничество с ведущими мировыми производствами полупроводников, ориентируясь на передовые техпроцессы. Применяя технологию совместной оптимизации проектирования (DTCO), они стремятся достичь оптимального соотношения между производительностью, энергопотреблением и площадью (PPA). Сообщается, что несколько облачных провайдеров уже изучают объединённое IP-портфолио NVIDIA и MediaTek. По неофициальным данным, Google уже прибегла к услугам MediaTek при разработке 3-нм TPU седьмого поколения, которое поступит в массовое производство к III кварталу 2026 года. Ожидается, что переход на 3-нм процесс принесет MediaTek более $2 млрд дополнительных поступлений. По данным источников в цепочке поставок, восьмое поколение TPU перейдёт на 2-нм процесс TSMC, что вновь укрепит позиции MediaTek. Также прогнозируется, что предстоящий выход чипа GB10 совместной разработки NVIDIA и MediaTek, и долгожданного чипа N1x, значительно улучшат бизнес-операции MediaTek и ещё больше укрепят позиции компании в полупроводниковой отрасли. Эксперты отрасли считают, что MediaTek имеет все возможности для того, что стать ключевым бенефициаром роста спроса на ИИ-технологии, особенно для малых и средних предприятий. |
|