Материалы по тегу: hardware
29.08.2024 [18:12], Владимир Мироненко
Квартальные результаты NVIDIA и прогноз превысили ожидания Уолл-стрит, но акции упали на 7 %NVIDIA объявила финансовые результаты за II квартал 2025 финансового года, завершившийся 28 июля 2024 года. Рост выручки компании уже четвёртый квартал подряд превышает ожидания аналитиков. В ходе отчёта компания поделилась прогнозом на следующие три месяца, тоже превысившим ожидания Уолл-стрит. Тем не менее в ходе расширенных торгов акции компании упали на 7 %. Выручка NVIDIA составила $30,04 млрд, что выше показателя предыдущего квартала на 15 % и на 122 % год к году. Это также значительно выше консенсус-прогноза аналитиков на уровне $20,75 млрд. NVIDIA повысила ожидания по выручке за III квартал до $32,5 млрд (рост год к году на 80 %), что немного выше консенсусного прогноза в $31,77 млрд. Тем не менее, как сообщила ещё до публикации отчёта ресурсу CNBC Стейси Расгон (Stacy Rasgon), аналитик Bernstein, ожидания инвесторов были ближе к $33–$34 млрд. Подразделение по выпуску продуктов для ЦОД принесло компании в отчётном квартале рекордную выручку в размере $26,3 млрд, превысившую результат предыдущего квартала на 16 % и на 154 % показатель годичной давности. При этом подразделение по выпуску вычислительных компонентов увеличило выручку год к году на 162 % до $22,6 млрд, а продажи сетевых решений повысились на 114 % до $3,7 млрд. Также объявлено, что выручка сегмента профессиональной визуализации увеличилась на 20 % до $454 млн, в автомобильном секторе выручка составила $346 млн (рост 37 %). Чистая прибыль (GAAP) NVIDIA выросла год к году на 168 % до $16,6 млрд или $0,67 на акцию. Чистая прибыль (Non-GAAP) увеличилась на 152 % до $16,9 млрд или $0,68 на акцию. Валовая прибыль составила во II квартале 2025 финансового года 75,1 %, что ниже показателя предыдущего квартала в размере 78,4 %. Как объяснила финансовый директор Колетт Кресс (Colette Kress), снижение связано с изменениями в конструкции ускорителей Blackwell GB200 следующего поколения. Недавно NVIDIA объявила о задержке выхода Blackwell, отметив, что рассчитывает нарастить поставки в IV квартале и получить дополнительно несколько миллиардов долларов дохода. Гендиректор NVIDIA Дженсен Хуанг (Jensen Huang) заявил, что платформа Blackwell будет способствовать росту так называемых «ИИ-фабрики ИИ» для поддержки чрезвычайно интенсивных рабочих нагрузок. Несмотря на впечатляющий рост бизнеса NVIDIA в сегменте ЦОД, старший аналитик Forrester Research Алвин Нгуен (Alvin Nguyen), выразил обеспокоенность по поводу того, что компания, возможно, «кладёт слишком много яиц в одну корзину». «Я всегда беспокоюсь, когда слишком много доходов сосредоточено на слишком малом количестве рынков, — сказал он, добавив: — Это не их вина. Рынок этого хочет». Бурный рост ЦОД сталкивается с недоступностью электроэнергии и воды, что влечёт за собой сопротивление местных властей. «В некоторых районах невозможно построить ЦОД, потому что он отбирает электроэнергию у 20 тыс. домов», — говорит Нгуен. Тем не менее, гиперскейлеры ищут способы обойти эти барьеры, и именно они могут принести более 45 % доходов ЦОД NVIDIA в течение следующих нескольких лет, говорит Лукас Ке (Lucas Keh), аналитик глобальной исследовательской компании Third Bridge Group Ltd. «Темпы прироста доходов от GPU, как ожидается, сохранятся в течение следующих 12–18 месяцев, — сказал он. — Наши эксперты полагают, что к концу 2025 года 60–70 % обучения (моделей) гипескейлеров будет проводиться на Blackwell». Впрочем, NVIDIA работает над диверсификацией источников доходов. В этом году она запустила десятки NIM-микросервисов, предназначенных для ускорения развёртывания базовых моделей на облачных платформах. NVIDIA также расширила экосистему библиотек CUDA, которые являются строительными блоками для ИИ-приложений. В компании по-прежнему порядка трёх четвертей инженеров занимается именно разработкой ПО. Кроме того, растут доходы компании от сетевых технологий.
29.08.2024 [17:11], Руслан Авдеев
Акции Supermicro обрушились после обвинений Hindenburg ResearchАкции Super Micro Computer Inc. (Supermicro) упали в цене более чем на 20 % после того, как известная на биржевом рынке инвестиционная компания Hindenburg Research опубликовала разгромный доклад об операциях производителя IT-комплектующих и серверов. Silicon Angle сообщает, что в отчётах имеются крайне тревожные для акционеров сведения. Hindenburg Research выявила соглашения между связанными сторонами — обычно таковые заключаются между компанией и её дочерними структурами на нерыночных условиях. Кроме того, Hindenburg Research обвинила компанию в нарушении санкционного режима в отношении России и других «прегрешениях» разной степени тяжести: снова нанятые сотрудники, ранее уволенные за недобросовестное ведение дел, отгрузка товаров низкого качества, выдача чужих инновации за свои, плохие сопровождение и постпродажное обслуживание и т.д. После выдвинутых претензий Supermicro объявила о намерении отложить подачу финансовой отчётности по форме K-10, сообщив, что менеджменту потребуется дополнительное время для оценки показателей. Правда, в компании не сказали, какие данные она намерена перепроверить. Сообщается, что Supermicro не пересмотрит отчётность за IV квартал и 2024 финансовый год в целом, опубликованные ранее в этом месяце. В последнем финансовом квартале фискального 2024 года, закончившегося 30 июня, выручка год к году более чем удвоилась, достигнув $5,31 млрд. Драйвером роста стал спрос на ИИ-оборудование компании, что также помогло буквально утроить цену акций Supermicro в I половине года. На момент написания материала акции оценивались почти в $430 каждая — более чем вдвое ниже исторического рекорда, поставленного в минувшем марте. Впрочем, они всё ещё несопоставимо дороже, чем в начале года, когда их цена опускалась до $285. Публикация доклада на этой неделе — не первый раз, когда финансовые показатели Supermicro ставились под вопрос. В 2020 году компания была вынуждена заплатить $17,5 млн для того, чтобы прекратить расследование, проводившееся Комиссией по ценным бумагам и биржам США (U.S. Securities and Exchange Commission, SEC) в связи с очередными проблемами с бухгалтерской отчётностью. А в 2018 году компанию и вовсе снимали с торгов Nasdaq. Большой спрос на ИИ-оборудование обеспечил компании высокую выручку и, похоже, тенденция сохранится в обозримом будущем. Компания прогнозирует, что выручка в текущем квартале составят $6–$7 млрд, т.е. более чем втрое выше, чем годом ранее. При этом компания перестала быть эксклюзивным поставщиком ИИ-систем CoreWeave и xAI и лишилась Digital Ocean как клиента — все они обратились к Dell. Более того, Supermicro упустила возможность поставки ИИ-кластеров для AWS.
29.08.2024 [16:41], Руслан Авдеев
Илон Маск показал ИИ-суперкластер Tesla Cortex из 50 тыс. ускорителей NVIDIAИлон Маск (Elon Musk) продолжает наращивать вычислительные мощности своих компаний. Как сообщает Tom’s Hardware, он поделился сведениями об ИИ-суперкластере Cortex. По данным Tom's Hardware, недавнее дополнение завода Giga Texas компании Tesla будет состоять из 70 тыс. ИИ-серверов, а также потребует 130 МВт энергии на обеспечение вычислений и охлаждения на момент запуска, к 2026 году мощность вырастет до 500 МВт. На опубликованном в социальной сети X видео Илона Маска показан машинный зал: по 16 IT-стоек в ряд, по два ряда на коридор. Каждая стойка вмещает восемь ИИ-серверов, а в середине каждого ряда видны стойки без таковых. В видео можно разглядеть порядка 16–20 рядов, поэтому довольно грубый подсчёт позволяет предположить наличие около 2 тыс. серверов с ускорителями, т.е. менее 3 % от запланированной ёмкости. В ходе июльского финансового отчёта Tesla Илон Маск рассказал, что Cortex будет крупнейшим обучающим кластером Tesla на сегодняшний день и будет состоять из 50 тыс. ускорителей NVIDIA H100 и 20 тыс. ускорителей Tesla D1 собственной разработки. Это меньше, чем Маск прогнозировал раньше, в июне он сообщал, что Cortex будет включать 50 тыс. D1. Правда, сообщалось, что на момент запуска будут применяться только решения NVIDIA, а разработки Tesla появятся позже. Кластер Cortex предназначен в первую очередь для обучения автопилота Full Self Driving (FSD), сервиса Cybertaxi и роботов Optimus, ограниченное производство которых должно начаться в 2025 году для использования на заводах компании. Также Маск анонсировал планы потратить $500 млн на суперкомпьютер Dojo в Буффало (штат Нью-Йорк), также принадлежащий Tesla. Первым же в «коллекции» Маска заработал Memphis Supercluster, принадлежащий xAI и оснащённый 100 тыс. NVIDIA H100. Со временем эта система получит 300 тыс. ускорителей NVIDIA B200, но задержки с их производством заставили отложить реализацию проекта на несколько месяцев.
29.08.2024 [14:55], Руслан Авдеев
CoreWeave развернёт в Швеции крупнейший в Европе ИИ-кластер NVIDIA BlackwellОблачный провайдер CoreWeave намерен арендовать ЦОД у шведского оператора EcoDataCenter. По данным Datacenter Dynamics, партнёры анонсировали сотрудничество для размещения «одного из крупнейших» в Европе кластеров NVIDIA Blackwell. CoreWeave заявила, что разместит тысячи новых ускорителей NVIDIA, чтобы удовлетворить спрос на крупномасштабную ИИ-инфраструктуру ведущих ИИ-лабораторий и компаний. Эти кластеры должны заработать уже в 2025 году. Дополнительные подробности о том, какие объекты будут использоваться и каков реальный масштаб проекта, неизвестны. По словам представителя CoreWeave, сотрудничество с EcoDataCenter стало поворотной точкой для экспансии в Европе. EcoDataCenter была сформирована в 2015 году шведской энергетической компанией Falu Energi & Vatten и оператором ЦОД EcoDC AB. В 2018 году застройщик Areim приобрёл контрольный пакет акций компании, обошедшийся приблизительно в $22 млн, а в 2019 году объединил её со шведским оператором Fortlax. Сейчас шведская компания управляет пятью дата-центрами на трёх площадках. Ранее в этом году она объявила о планах постройки нового 150-МВт кампуса EcoDataCenter 2. Кампус будут строить поэтапно, первый блок на 20 МВт построят уже в 2026 году. Основанная в 2017 году компания CoreWeave изначально специализировалась на крипто- и блокчейн-технологиях и активно инвестировала в облачные проекты, обеспечивая доступ клиентам к ускорителям. За последние два года компания привлекла $12 млрд в виде инвестиций и прямых займов и планирует потратить $3,5 млрд на расширение бизнеса в Европе, в том числе в Норвегии и Великобритании. К концу 2024 года компания рассчитывает управлять 28 объектами по всему миру, в прошлом году речь шла всего о 14 ЦОД.
28.08.2024 [16:47], Руслан Авдеев
Дата-центр xAI в Мемфисе загрязняет воздух своими генераторами, но других мощных источников энергии у ЦОД пока нетНКО Campaign group the Southern Environmental Law Center (SELC) призывает власти расследовать деятельность компании xAI Илона Маска (Elon Musk). По данным Datacenter Dynamics, активисты обвиняют ИИ-стартап в том, что используемые на территории его дата-центра генераторы усугубляют ситуацию с загрязнением воздуха в регионе. Представители SELC обратились в департамент здравоохранения округа Шелби (Shelby) штата Теннесси США, утверждая, что на площадке xAI в южной части Мемфиса применяется 18 генераторов, на использование которых необходимо получить разрешение властей. ЦОД xAI расположен на месте бывшего завода Electrolux площадью 69 677 м2, который закрылся в 2022 году. Илон Маск ранее заявлял, что со временем дата-центр будет использовать до 100 тыс. ускорителей NVIDIA H100 (часть которых забрали у Tesla) для обучения и обеспечения работы языковой модели Grok. Второй кластер из 300 тыс. ускорителей B200 планируется ввести в эксплуатацию в следующем году. Для этого потребуется много энергии. В xAI пообещали вложить $24 млн в строительство подстанции, которая обеспечит ЦОД до 150 МВт (если одобрит оператор энергосети штата), но пока центр имеет доступ только к 7 МВт. Для решения проблемы подготовлены 14 генераторов Voltagrid на природном газе, каждый из которых способен обеспечить до 2,5 МВт. В письме SELC говорится, что компания Solar Turbines также установила на территории четыре турбины SMT-130 мощностью по 16 МВт. Предполагается, что это только усугубит проблему низкого качества воздуха в округе Шелби. Уровень приземного озона в регионе уже превышал допустимые нормы в последние три года, и вероятно, то же самое произойдёт и в 2024 году. Загрязнение озоном обостряет заболевания лёгких, такие как эмфизема и хронический бронхит, и увеличивает частоту приступов астмы. Между тем, генераторы xAI, предположительно, выбрасывают около 130 тонн прекурсоров O3 — оксидов азота (NOx) — ежегодно, что делает их девятым по масштабу источником таких оксидов в округе. SELC, выступающая от имени нескольких жилых сообществ Мемфиса, добавила, что минимальным требованием является получение разрешений для четырёх 16-МВт турбин до их установки и ввода в эксплуатацию — даже если они временные. Также необходимо потребовать получение разрешений на малые генераторы. Департамент здравоохранения округа призвали отреагировать на эксплуатацию генераторов без разрешений и принять предусмотренные законом меры за их использование без соответствующих разрешений. SELC уже не первый год борется со строительством дата-центра xAI. В июле группа предупредила о «вредоносных последствиях» для местных жителей из-за роста нагрузки на энергосети Мемфиса. Утверждается, что объект требует «непостижимые» 150 МВт уже к концу 2024 года — столько энергии достаточно для питания 100 тыс. домохозяйств. Это может сказаться на здоровье и даже жизнях местных жителей, поскольку во время пиковых нагрузок люди могут остаться без отопления или кондиционеров. Компания Маска также вызвала недовольство местных властей, которые заявили, что узнали о планах строительства дата-центра из средств массовой информации.
28.08.2024 [16:33], Руслан Авдеев
Власти Ирландии сорвали проект по строительству ЦОД Google — он недостаточно экоустойчивПланы Google по расширению сети дата-центров в районе Дублина так и не будут реализованы. По данным The Register, власти Ирландии посчитали, что проект нового ЦОД недостаточно экологичен. Неизвестно, будет ли компания обжаловать отказ. Недавно Google признала, что вместо снижения выбросов парниковых газов только наращивает их — с 2019 года выбросы выросли на 48 %. В компании объясняют это ростом сети ЦОД из-за большого спроса на ИИ-решения, но просят не переживать. Решение было принято на прошлой неделе, но информация о нем появилась только сейчас. Тем временем совет муниципального округа Южный Дублин аннулировал разрешение сроком на 10 лет на строительство дата-центра Google площадью 72 400 м² с сопутствующей инфраструктурой на территории Grange Castle Business Park недалеко от ирландской столицы. В окрестностях Дублина фактически действует мораторий на новые ЦОД, за исключением тех, которые получили разрешение ранее. Основной причиной отказа стало негативное воздействие проекта на окружающую среду. Власти констатировали, что предложение Google неприемлемо из-за недостаточной емкости национальной электросети и нехватки источников возобновляемой энергии непосредственно площадки. Ирония в том, что местные регуляторы считают последний показатель недостаточным, если он ниже 100 %. При этом Microsoft разрешили построить новый ЦОД Grange Castle Business Park, разместив по соседству 170-МВт газовую электростанцию, которую, судя по всему, посчитали достаточно экологичной. Совет также выразил недовольство недостаточной прозрачностью текущих PPA-соглашений, связанных с бизнесом в Ирландии, а также отсутствием подключения к ближайшей сети центрального отопления. Кроме того, Google предоставила слишком мало деталей о том, как проект повлияет на энергоснабжение после ввода в эксплуатацию в 2027 году. Также было заявлено, что предложение Google не соответствует местным правилам, связанным с сохранением и защитой «зеленой» инфраструктуры и экологическим требованиям совета. Иными словами, компания была признана недостаточно «зеленой» для строительства очередного крупного ЦОД вблизи ирландской столицы. НКО National Trust For Ireland поддержала решение властей в своем письме, отметив, что новый объект стал бы источником эквивалента дополнительных 224 250 тонн CO2 ежегодно, что составляет 0,44 % от всех выбросов CO2 в стране. Такой рост загрязнений не соответствует принятым в Ирландии экологическим обязательствам, а правила строительства ЦОД в стране следовало бы уже пересмотреть. Отмечается, что строительство дата-центров ранее почти не контролировалось, и сейчас ЦОД фактически потребляют 21 % всей электроэнергии в стране, тогда как в 2015 году этот показатель составлял лишь 5 %.
28.08.2024 [14:26], Руслан Авдеев
Meta✴ будет снабжать свои ЦОД в США энергией из петротермальных источниковВ Meta✴ намерены снабжать свои американские дата-центры геотермальной (петротермальной) энергией. По данным Datacenter Dynamics, компания анонсировала сделку со стартапом Sage Geosystems об использовании технологий последнего для обеспечения ЦОД электричеством. Sage Geosystems будет использовать разработку Geopressured Geothermal System (GGS) для поставки клиенту «зелёной» энергии. Первая фаза проекта должна заработать в 2027 году. В Meta✴ рассчитывают получить до 150 МВт базовой петротермальной мощности для своих объектов. Пока не сообщается, какие именно ЦОД будут снабжаться энергией из «безуглеродных» источников. Впрочем, в Sage проговорились, что речь идёт о местности к востоку от Скалистых гор. В Sage Geosystems назвали проект прекрасным примером того, как государственный и частный сектор могут сотрудничать в деле перехода на «чистую» энергию и поблагодарили Министерство энергетики (DOE) за поддержку коммерциализации инновационных решений. Как сообщают в компании, в основном геотермальная энергия используется в штатах Невада, Юта и Калифорния. Что касается Meta✴, то компания заключила контракты на поставку более 12 ГВт электричества из возобновляемых источников по всему миру, став одним из крупнейших корпоративных покупателей возобновляемой энергии в мире. В Sage заявляют, что петротермальные системы — более распространённый и доступный источник энергии, чем гидротермальные скважины. Петротермальные системы прокачивают в замкнутом контуре воду между поверхностью Земли и подземными горячими породами. Можно бурить как собственные скважины, так и перепрофилировать некоторые «сухие» нефтяные скважины. Также Sage работает над технологиями долговременного хранения энергии. В прошлом году небольшой пилотный проект смог обеспечить 200 кВт в течение более 18 часов и 1 МВт — в течение 30 минут. Техасская Sage Geosystems основана в 2020 году бывшими сотрудниками Shell. В раунде финансирования серии A компания привлекла $17 млн. Средства будут направлены на строительство первого коммерческого GGS-проекта компании мощностью 3 МВт в Техасе, недалеко от Сан-Антонио. Геотермальная электростанция должна заработать ещё до конца 2024 года. Ранее Sage подписала сделку с американской армией для обеспечения энергией военных объектов в Нью-Мексико и Техасе. Также она изучает возможность использования геотермальной энергетики в интересах базы ВВС США в Хьюстоне (Техас). Ранее Google заключила контракт с Fervo Energy и NV Energy на покупку более 100 МВт геотермальной энергии в Неваде. Соглашение о покупке «чистой» энергии (PPA) заключила с Contact Energy в Новой Зеландии компания Microsoft, также она строит геотермальный кампус в Кении вместе с G42. В Индонезии Star Energy обсуждает с операторами ЦОД строительство объектов недалеко от геотермальных электростанций, PDG также подписала «геотермальный» контракт для своих ЦОД в Индонезии. На Филиппинах Converge заключила соглашение о поставках аналогичной энергии с местной электрокомпанией. В Калифорнии стартап CalEthos намерен построить крупный кампус с энергоснабжением из аналогичных источников. Наконец, итальянский стартап Geoveda Srl намерен построить небольшой ЦОД с геотермальным питанием в Тоскане.
28.08.2024 [12:32], Сергей Карасёв
Sapphire Rapids Refresh для рабочих станций: Intel Xeon W-2500 и W-3500 получили до 60 ядер и до 112,5 Мбайт кешаКорпорация Intel, по сообщению ресурса VideoCardz, представила процессоры Xeon W-2500 и W-3500 поколения Sapphire Rapids Refresh. Эти чипы предназначены для применения в рабочих станциях и высокопроизводительных настольных компьютерах. Они придут на смену семействам Xeon W-3400 и W-2400. В серию Xeon W-2500 вошли изделия с 26, 22, 18, 14, 12, 10 и 8 ядрами. Во всех случаях поддерживается технология многопоточности. Объём кеша L3 варьируется от 22,5 до 48,75 Мбайт. Версии с 8 и 10 ядрами могут работать с памятью DDR5-4400, все другие модели — с DDR5-4800 (четыре канала). Показатель базовой мощности (Processor Base Power, PBP) варьируется от 175 до 250 Вт. Семейство Xeon W-2500 возглавляет модель Xeon W7-2595X с 26 ядрами: базовая частота равна 2,8 ГГц, максимальная — 4,8 ГГц. Этот чип, как и другие решения с суффиксом «X», имеет разблокированный множитель, благодаря чему обеспечивается возможность разгона. Все процессоры серии поддерживают 64 линии PCIe 5.0. Цена варьируется от $609 до $2039. Более мощные изделия Xeon W-3500 насчитывают от 16 до 60 ядер с поддержкой многопоточности. Размер кеша L3 — от 45 до 112,5 Мбайт. Все процессоры могут работать с памятью DDR5-4800 (восемь каналов). Количество линий PCIe 5.0 равно 112. Значение PBP находится в диапазоне от 290 до 385 Вт. На вершине семейства располагается модель Xeon W9-3595X с базовой частотой 2,0 ГГц и максимальной частотой 4,8 ГГц. Цена варьируется от $1339 до $5889. Новые процессоры рассчитаны на работу с материнскими платами на чипсете Intel W790.
28.08.2024 [11:55], Руслан Авдеев
Inventec продаст AMD свою долю в ZT Systems, получив деньги и пакет акцийВ рамках сделки по покупке компанией AMD поставщика серверных и облачных решений ZT Systems, компания Inventec, владеющая 10 % акций последней, выразила готовность продать свою долю за $411 289 377. По информации DigiTimes, Inventec помимо денег получит и акции AMD. Inventec продаёт свою долю для укрепления финансовых позиций и, вероятно, концентрации усилий на других сферах бизнеса. Общая сумма сделки AMD по покупке ZT Systems составляет $4,9 млрд, 75 % стоимости будет выплачена денежными активами, оставшиеся 25 % — акциями самой AMD. В рамках сделки Inventec продаст простые акции и фондовые опционы в ZT Systems. После завершения сделки компания также получит около 884 тыс. акций AMD. Поскольку AMD выразила намерение продать часть бизнеса ZT Systems, отвечающую непосредственно за производство, не исключено, что Inventec впоследствии захочет выкупить её. В самой компании отказались комментировать предположение. В Wistron, тоже выпускающей серверы для гиперскейлеров, на вопрос о возможной передаче ей производственных мощностей ZT Systems сообщили, что инициатива теперь принадлежит AMD и пока планов подобного «поглощения» нет. Inventec начала поставлять серверы ключевым облачным провайдерам в 2019 году, в том числе Amazon, Microsoft и Meta✴, инвестировав и в ZT Systems. Позже Inventec и ZT Systems сотрудничали над производством серверов для NVIDIA. Inventec в этой цепочке занималась установкой материнских плат и общей подготовкой шасси серверов (уровень L6), а ZT Systems отвечала за финальную сборку и тестирование готовых серверов (L10), а также за интеграцию систем на заключительном этапе (L11).
28.08.2024 [09:14], Владимир Мироненко
Google поделилась подробностями истории создания ИИ-ускорителей TPUВ огромной лаборатории в штаб-квартире Google в Маунтин-Вью (Калифорния, США) установлены сотни серверных стоек с ИИ-ускорителями TPU (Tensor Processing Unit) собственной разработки, с помощью которых производится обучение больших языковых моделей, пишет ресурс CNBC, корреспонденту которого компания устроила небольшую экскурсию. Первое поколение Google TPU, созданное ещё в 2015 году, и представляет собой ASIC для обработки ИИ-нагрузок. Сейчас компания использует такие, хотя и более современные ускорители для обучения и работы собственного чат-бота Gemini. С 2018 года TPU Google доступны облачным клиентам компании. В июле этого года Apple объявила, что использует их для обучения моделей ИИ, лежащих в основе платформы Apple Intelligence. «В мире есть фундаментальное убеждение, что весь ИИ, большие языковые модели, обучаются на (чипах) NVIDIA, и, конечно, на решения NVIDIA приходится львиная доля объёма обучения. Но Google пошла по собственному пути», — отметил гендиректор Futurum Group Дэниел Ньюман (Daniel Newman). Благодаря расширению использованию ИИ подразделение Google Cloud увеличило доход, и в последнем квартальном отчёте холдинг Alphabet сообщил, что выручка от облачных вычислений выросла на 29 %, впервые превысив $10 млрд за квартал. Google была первым провайдером облачных вычислений, создавшим кастомные ИИ-чипы. Лишь спустя три года Amazon Web Services анонсировала свой первый ИИ-ускоритель Inferentia, Microsoft представила ИИ-ускоритель Azure Maia 100 в ноябре 2023 года, а в мае того же года Meta✴ рассказала об семействе MTIA. Однако лидирует на рынке генеративного ИИ компания OpenAI, обученная на ускорителях NVIDIA, тогда как нейросеть Gemini была представлена Google спустя год после презентации ChatGPT. В Google рассказали, что впервые задумались о создании собственного чипа в 2014 году, когда в руководстве решили обсудить, насколько большими вычислительными возможностями нужно обладать, чтобы дать возможность всем пользователям поговорить с поиском Google в течение хотя бы 30 с каждый день. По оценкам, для этого потребовалось бы удвоить количество серверов в дата-центрах. «Мы поняли, что можем создать специальное аппаратное обеспечение, <…> в данном случае тензорные процессоры, для обслуживания [этой задачи] гораздо, гораздо более эффективно. Фактически в 100 раз эффективнее, чем было бы в противном случае», — отметил представитель Google. С выходом второго поколения TPU в 2018 году Google расширила круг выполняемых чипом задач, добавив к инференсу обучение ИИ-моделей. Процесс создания ИИ-ускорителя не только отличается высокой сложностью, но и требует больших затрат. Так что реализация таких проектов в одиночку не по силам даже крупным гиперскейлерам. Поэтому с момента создания первого TPU Google сотрудничает с разработчиком чипов Broadcom, который также помогает её конкуренту Meta✴ в создании собственных ASIC. Broadcom утверждает, что потратила более $3 млрд в рамках реализации совместных проектов. В рамках сотрудничества Google отвечает за собственно вычислительные блоки, а Broadcom занимается разработкой I/O-блоков, SerDes и иных вспомогательных компонентов, а также упаковкой. Самы чипы выпускаются на TSMC. С 2018 года в Google трудятся ещё одни кастомные чипы — Video Coding Unit (VCU) Argos, предназначенной для обработки видео. Что касается TPU, то в этом году клиентам Google будет доступно шестое поколение TPU Trillium. Более того, им станут доступны и первые Arm-процессоры Axion собственной разработки. Google выходит на этот рынок с большим отставанием от конкурентов. Amazon выпустила первый собственный процессор Graviton в 2018 году, Alibaba Yitian 710 появились в 2021 году, а Microsoft анонсировала Azure Cobalt 100 в ноябре. Все эти чипы основаны на архитектуре Arm — более гибкой и энергоэффективной альтернативе x86. Энергоэффективность имеет решающее значение. Согласно последнему экологический отчёту Google, с 2019 по 2023 год выбросы компании выросли почти на 50 %, отчасти из-за увеличения количества ЦОД для ИИ-нагрузок. Для охлаждения ИИ-серверов требуется огромное количество воды. Именно поэтому начиная с третьего поколения TPU компания использует прямое жидкостное охлаждение, которое только теперь становится практически обязательным для современных ИИ-ускорителей вроде NVIDIA Blackwell. |
|