Материалы по тегу: ии

13.11.2024 [22:21], Руслан Авдеев

Поработайте за нас: AWS предоставит учёным кластеры из 40 тыс. ИИ-ускорителей Trainium

AWS намерена привлечь больше людей к разработке ИИ-приложений и фреймворков, использующих разработанные Amazon ускорители семейства Tranium. В рамках нового инициативы Build on Trainium с финансированием в объёме $110 млн академическим кругам будет предоставлен доступ к кластерам UltraClaster, включающим до 40 тыс. ускорителей, сообщает The Register.

В рамках программы Build on Trainium предполагается обеспечить доступ к кластеру представителям университетов, которые заняты разработкой новых ИИ-алгоритмов, которые позволяет повысить эффективность использования ускорителей и улучшить масштабирование вычислений в больших распределённых системах. На каком поколении чипов, Trainium1 или Trainium2, будут построены кластеры, не уточняется.

 Источник изображений: AWS

Источник изображений: AWS

Как поясняют в самом блоге AWS, исследователи могут придумать новую архитектуру ИИ-моделей или новую технологию оптимизации производительности, но у них может не оказаться доступа к HPC-ресурсам для крупных экспериментов. Не менее важно, что плоды трудов, как ожидается, будут распространяться по модели open source, поэтому от этого выиграет вся экосистема машинного обучения.

Впрочем, со стороны AWS альтруизма мало. Во-первых, $110 млн будут выданы выбранным проектам в виде облачных кредитов, такое происходит не впервые. Во-вторых, компания фактически пытается переложить часть своих задач на других людей. Кастомные чипы AWS, включая ИИ-ускорители для обучения и инференса, изначально разрабатывались для повышения эффективности выполнения внутренних задач компании. Однако низкоуровневые фреймворки и т.п. ПО не предназначены для того, чтобы с ними мог свободно работать широкий круг лиц как, например, происходит с NVIDIA CUDA.

Иными словам, AWS для популяризации Trainium необходимо более простое в освоение ПО, а ещё лучше готовые решения прикладных задач. Неслучайно Intel и AMD склонны предлагать разработчикам готовые оптимизированные под их ускорители фреймворки вроде PyTorch и TensorFlow, а не пытаться заставить их заниматься достаточно низкоуровневым программированием. AWS занимается тем же самым, предлагая продукты вроде SageMaker.

Во многом реализация проекта возможна благодаря новому интерфейсу Neuron Kernel Interface (NKI) для AWS Tranium и Inferentia, обеспечивающему прямой доступ к набору инструкций чипов и позволяющему исследователям строить оптимизированные вычислительные ядра для работы новых моделей, оптимизации производительности и инноваций в целом. Впрочем, учёным — в отличие от обычных разработчиков — часто интересно работать именно с низкоуровневыми системами.

Постоянный URL: http://servernews.kz/1113909
12.11.2024 [18:25], Руслан Авдеев

Французская EDF готова запитать от АЭС три гигаваттных ИИ ЦОД

Французская государственная энергоснабжающая компания EDF (Électricité de France), которая является одним из крупнейших в мире производителей атомной энергии, обсуждает поставки электричества для трёх кампусов ЦОД во Франции мощностью 1 ГВт каждый. По данным Reuters, соответствующей информацией поделился представитель ED.

В октябре EDF запустила Project Giga для удовлетворения растущего спроса на энергию со стороны ИИ ЦОД. В рамках проекта планируется использовать землю и инфраструктуру EDF для поставок низкоуглеродной энергии гиперскейлерам вроде Microsoft и Google. В том же месяце выработка атомной энергии во Франции составляла 30,0 ТВт∙ч, на 1,7 ТВт∙ч больше год к году. С начала года ежегодные кумулятивные поставки составили 292,0 ТВт∙ч, на 30,7 ТВт∙ч больше в сравнении с 2023 годом, отмечает Datacenter Dynamics.

Несмотря на рост интереса к «мирному атому» на европейском рынке, активнее и радушнее всего атомную энергию принимают в США, это касается как обычных атомных электростанций, так и малых модульных реакторов (SMR). В сентябре Microsoft согласились заключить PPA на 20 лет с Constellation Energy для получения 100 % электричества с АЭС Three Mile Island в Пенсильвании. В марте AWS приобрела кампус ЦОД Talen Energy рядом АЭС Susquehanna, тоже в Пенсильвании — за $650 млн.

 Источник изображения: Jametlene Reskp / Unsplash

Источник изображения: Jametlene Reskp / Unsplash

В секторе SMR компания подписала три соглашения для содействия внедрению SMR для питания ЦОД. В том числе речь идёт о соглашениях с Energy Northwest и Dominion Energy, а также прямых инвестициях в разработчика SMR — X-energy. Не так давно Google анонсировала сделку на поставку 500 МВт с разработчиком SMR— Kairos Power. Компания рассчитывает, что первые из шести-семи реакторов в рамках соглашения заработают в 2030 году.

Постоянный URL: http://servernews.kz/1113869
11.11.2024 [19:03], Руслан Авдеев

Softbank животворящий: Graphcore активно нанимает персонал для разработки новых ИИ-решений

Через четыре месяца после покупки японским конгломератом SoftBank британский стартап Graphcore, разрабатывающий ИИ-ускорители, занялся наймом новых сотрудников. По данным EE Times, сейчас у компании открыто 75 позиций в сферах разработки и тестирования полупроводников, управления инфраструктурой ЦОД и ИИ-исследований. Всего год назад компания спешно искала финансирование и сокращала персонал.

Сейчас штат Graphcore насчитывает 375 человек, но компания намерена увеличить количество сотрудников на 20 % в Великобритании, Польше и на Тайване. Прочие офисы, включая подразделение в Китае, закрылись. По словам главы Graphcore Найджела Туна (Nigel Toon), компания представляет собой место, где эксперты по полупроводникам, ПО, ИИ и т.п. могут и полностью реализовать себя. Тем не менее, производственные планы бизнеса пока не раскрываются.

 Источник изображения: Graphcore

Источник изображения: Graphcore

На момент покупки Graphcore имела в своём портфолио три поколения чипов. Однако последнее поколение Bow IPU, выпущенное в 2022 году, по большому счёту являлось апгрейдом продукта второго поколения от 2020 года. Модель имела 892 Мбайт набортной SRAM, дополненной внешней DDR-памятью, а не HBM. Другими словами, теоретически продукт не слишком подходит для обучения больших языковых моделей (LLM). Впрочем, Cerebras тоже использует SRAM в составе своих суперчипов, но последняя дополнена массивами гибридной памяти MemoryX. А SambaNova в SN40L в итоге пришла к сочетанию SRAM, HBM и DDR.

Если Graphcore намерена создать новое поколение ИИ-ускорителей, то она, вероятно, пойдёт по пути SambaNova, считают в EE Times. На это косвенно указывает вакансия инженера ЦОД, для которой желателен опыт работы с жидкостным охлаждением. Также компании требуются специалисты для работы над облачными платформами и инфраструктурой ЦОД. Не исключено, что компания сменит бизнес-модель на манер Groq, продавая не ускорители, а доступ к ИИ-сервисам. Cerebras и SambaNova, например, уже успели по очереди похвастаться производительностью своих инференс-платформ.

В случае Graphcore смещение фокуса на инференс открывает возможности для освоения корпоративных и суверенных ИИ-решений, которых ещё не было, когда последние чипы компании вышли на рынок. Тем не менее, пока нет данных, готов ли SoftBank обеспечить Graphcore достаточными средствами для развития больших ЦОД.

Постоянный URL: http://servernews.kz/1113803
11.11.2024 [15:06], Руслан Авдеев

Tencent инвестирует $500 млн в облачную и ИИ-инфраструктуру в Индонезии

Tencent Holdings обязалась инвестировать ещё $500 млн в развитие бизнеса в Индонезии к 2030 году. По данным The Wall Street Journal, компания намерена построит третий ЦОД в стране, поскольку техногигант из КНР рассчитывает укрепить сотрудничество GoTo с Group и Alibaba Group для развития облачной инфраструктуры в стране и заняться обучением здесь талантливых специалистов.

Индонезийская GoTo в минувшее воскресенье сообщила о новых соглашениях с Tencent и Alibaba на мероприятии Indonesia-China Business Forum. Кроме того, не так давно президент Индонезии Прабово Субианто (Prabowo Subianto) посетил с официальным визитом Пекин, объявив о новых соглашениях между Индонезийской торгово-промышленной палатой (Indonesian Chamber of Commerce and Industry) и крупными китайскими компаниями, которые предусматривают инвестиции в размере $10 млрд.

Tencent планирует построить в Индонезии свой третий дата-центр. Это позволит Tencent поставлять местным компаниям облачные и ИИ-решения. Общий объём инвестиций составит $500 млн. Alibaba Cloud, уже имеющая в стране три ЦОД, планирует удвоить количество специалистов в области ИИ и облачных решений. В частности, компания намерена открыть образовательный центр в Университете Индонезии (Universitas Indonesia).

 Источник изображения: Tencent

Источник изображения: Tencent

Планируемые инвестиции Tencent Cloud и Alibaba Cloud неразрывно связаны с облачными контрактами с местной технологической компанией GoTo. Последняя намерена использовать опыт китайских компаний в анализе данных, ИИ и кибербезопасности. В мае намерение инвестировать $1,7 млрд в ИИ и облака в Индонезии выразила Microsoft, а буквально на днях о планах развития ИИ в стране объявили и в российском «Яндексе».

Постоянный URL: http://servernews.kz/1113810
11.11.2024 [11:29], Сергей Карасёв

США запретили TSMC выпускать передовые чипы для китайских ИИ-компаний

TSMC, по сообщению The Register, полностью прекратит выпуск передовых изделий для китайских заказчиков, которые занимаются разработкой аппаратных ИИ-решений, включая ускорители на базе GPU. Данная мера, как утверждается, продиктована необходимостью соблюдения экспортных требований США.

Власти США последовательно вводят различные санкции, призванные ограничить возможности китайской полупроводниковой индустрии. Речь идёт о закупках чипов NVIDIA, памяти HBM и других компонентов. А нидерландской компании ASML запрещено поставлять в Китай оборудование для DUV-литографии, на котором можно изготавливать 5- и 7-нм продукцию.

Теперь новые ограничительные меры в отношении клиентов из КНР вводит TSMC. Этот контрактный производитель объявил о том, что с 11 ноября 2024 года прекращает отгружать чипы, произведённые по 7-нм и более совершенным технологиям, китайским заказчикам, которые занимаются разработкой ИИ-устройств и GPU.

Напомним, что в октябре TSMC уведомила американские власти о том, что некий китайский клиент, по всей видимости, пытается обойти экспортный контроль в отношении Huawei, размещая заказы на изделия, схожие с ИИ-ускорителем Ascend 910B. Это продукт был разработан Huawei в качестве альтернативы NVIDIA A100. Решение Ascend 910B представляет собой следующее поколение 7-нм чипа Ascend 910. По имеющейся информации, TSMC, следуя экспортным ограничения США, прекратила все поставки изделий этому неназванному клиенту.

 Источник изображения: TSMC

Источник изображения: TSMC

Решение TSMC ограничит возможности китайских компаний по использованию технологий с нормами 7-нм и менее при создании ИИ-устройств. Вместе с тем, подчёркивается, что правила не распространяются на китайских клиентов, которые заказывают у TSMC 7-нм чипы для других приложений, таких как мобильные устройства и системы связи.

Как отмечает TrendForce, решение TSMC «отражает осторожную позицию гиганта контрактного производства в глобальной цепочке поставок полупроводников на фоне разгорающейся войны в сфере микрочипов между двумя мировыми сверхдержавами».

Постоянный URL: http://servernews.kz/1113791
11.11.2024 [11:27], Сергей Карасёв

«Яндекс» планирует инвестировать в развитие ИИ в Индонезии

Компания «Яндекс» намерена инвестировать средства в развитие экосистемы ИИ в Индонезии. Об этом, как сообщает Reuters, объявила министр связи и информационных технологий страны Меутья Хафид (Meutya Hafid), не вдаваясь в подробности инициативы.

Отмечается, что 7 ноября 2024 года Хафид встретилась с Александром Поповским, главой международного поискового подразделения «Яндекса». Российская компания озвучила планы по «расширению поисковой платформы в Индонезии». О размере инвестиций и сроках реализации проекта ничего не известно.

По всей видимости, «Яндекс» намерен развивать в Индонезии различные востребованные сервисы, включая поиск, на базе ИИ. Недавно компания анонсировала семейство моделей YandexGPT 4, которое включает мощную языковую модель Pro и облегчённую версию Lite. Они значительно превосходят по качеству ответов предыдущие версии, способны рассуждать и обрабатывать в четыре раза более длинные запросы — около 60 страниц текста. Это позволяет использовать нейросети для решения более сложных и разнообразных бизнес-задач. Модели YandexGPT доступны в виртуальном ассистенте «Алисе», работают в поиске, браузере и других сервисах «Яндекса».

 Источник изображения: unsplash.com / Growtika

Источник изображения: unsplash.com / Growtika

Индонезия, где проживает большое количество молодых людей, разбирающихся в технологиях, привлекает существенный интерес со стороны мировых IT-корпораций. В частности, Microsoft намерена в течение четырёх лет инвестировать в облачную инфраструктуру и ИИ-проекты Индонезии $1,7 млрд. А NVIDIA и индонезийская телекоммуникационная компания Indosat Ooredoo Hutchison планируют построить ИИ-центр стоимостью $200 млн в Центральной Яве.

Постоянный URL: http://servernews.kz/1113794
09.11.2024 [22:23], Сергей Карасёв

Huawei скрестила SSD с лентой в MED-накопителе: из-за санкций компания больше не может полагаться на поставки HDD

Huawei, по сообщению Blocks​&​Files, разрабатывает технологию хранения больших объёмов данных на основе так называемых магнитоэлектрических дисков (MED). Фактически речь идёт о совмещении SSD и ленточных накопителей в одном корпусе, что позволит объединить преимущества «горячего» и «холодного» хранения. Необходимость создания СХД нового типа обусловлена жёсткими санкциями со стороны США — Huawei опасается возможных перебоев с закупками традиционных HDD.

Концепция MED заключается в объединении в одном герметичном корпусе носителей разных типов. Это твердотельный накопитель на основе флеш-памяти NAND и ленточная система, включающая привод, катушки с лентой и головки чтения-записи. Таким образом, для работы с «горячими» данными может использоваться SSD, обеспечивающий низкие задержки и высокие скорости чтения/записи, а с «холодными» — ленточный модуль. Длина ленты приблизительно вдвое меньше, чем в LTO-картриджах, т.е. около 480 м вместо 960 м.

Конструктивно MED напоминает кассету для магнитофона и содержит две катушки для ленты, электромотор и головки. MED имеет блочный интерфейс и два слоя трансляции. При записи информация попадает сначала на SSD, а после переупорядочивания последовательно записывается на ленту. При чтении накопитель, опираясь на метаданные во флеш-памяти, считывает данные либо с SSD («тёплые»), либо с ленты («холодные»). В последнем случае задержка доступа может составлять до двух минут.

 Источник изображения: Blocks & Files

Источник изображения: Blocks & Files

В составе платформы MED не используются технологии ленточных накопителей IBM, Fujifilm или Sony. Вместо этого Huawei разработала необходимые компоненты совместно с китайскими партнёрами, а чипы NAND и так производятся в КНР. Это обеспечивает независимость от зарубежных изделий, которые могут подпасть под санкции. Шасси MED не нуждается в роботизированных манипуляторах и обеспечивает высокую плотность размещения накопителей.

MED первого поколения вмещает 72 Тбайт информации, потребляя при этом всего 10 % электроэнергии, необходимой обычному жёсткому диску. Совокупная стоимость владения (TCO) примерно на 20 % ниже по сравнению с другими ленточными системами эквивалентной ёмкости. Стойка MED первого поколения обеспечивает скорость передачи данных на уровне 8 Гбит/с, вмещает более 10 Пбайт информации и потребляет менее 2 кВт. Системам MED не грозит перегрев, поскольку они в основном рассчитаны на хранение архивных данных.

На систему MED и её компоненты компанией Huawei получен ряд патентов. Решения первого поколения, как ожидается, выйдут в 2025 году. А на 2026–2027 гг. запланирован выпуск устройств второго поколения с отсеками формата 3,5″ (LFF). Нечто похожее предложила и Western Digital — компания запатентовала высокоинтегрированный LTO-картридж в корпусе HDD. Что касается дальнейших планов Huawei, то сейчас она разрабатывает собственные SSD вместимостью 60 Тбайт на основе флеш-памяти QLC NAND с SLC-кешированием.

Постоянный URL: http://servernews.kz/1113747
09.11.2024 [20:20], Руслан Авдеев

Жители Мемфиса не рады развитию ИИ-суперкомпьютера xAI Coloussus Илона Маска

Активисты из числа жителей американского Мемфиса раскритиковали оператора энергосети Tennessee Valley Authority (TVA) за предоставление стартапу xAI Илона Маска доступа к дополнительным 150 МВт для питания ИИ-суперкомпьютера Colossus, сообщает Datacenter Dynamics. В минувший четверг TVA одобрил запрос от энергокомпании Memphis Light, Gas and Water (MLGW).

Colossus предназначен для обучения и обслуживания ИИ-бота Grok, заработавшего ранее в этом году. Суперкомпьютер разместился в помещениях бывшего завода Electrolux в промышленном парке на юго-востоке Мемфиса. Ранее Маск заявлял, что речь идёт о самом быстром в мире ИИ-суперкомпьютере, включающем 100 тыс. ускорителей NVIDIA H100. Правда, буквально через несколько дней Meta похвасталась ещё более крупной системой для обучения Llama-4. Но и Маск обещал в ближайшие месяцы удвоить мощность суперкомпьютера, который получит 50 тыс. ускорителей NVIDIA H200.

Всё это означает, что машине потребуется много энергии. Ранее в этом году MLGW согласилась обеспечить xAI ещё 150 МВт, ожидалось лишь одобрение TVA. Комплекс даже пришлось запитать от мобильных газовых генераторов Voltagrid, что само по себе вызвало недовольство местных жителей. xAI со своей стороны пообещала построить крупнейшую в мире систему очистки сточных вод с керамическим мембранами, а также с дисконтом предоставлять ресурсы энергохранилища Tesla Megapack, построенного рядом с Colossus, для поддержки стабильности энергосети Мемфиса.

 Источник изображения: Heidi Kaden/unsplash.com

Источник изображения: Heidi Kaden/unsplash.com

Новость не вызывала энтузиазма у местных активистов и экозащитников, обеспокоенных вероятной нагрузкой на энергосети города и низким качеством воздуха. Активисты также подчёркивают, что оператор TVA обязан служить интересам общества и изучить последствия выделения xAI дополнительных 150 МВт, поскольку регион и так страдает от высоких нагрузок на сети и загрязнения окружающей среды. Дело, в частности, в том, что TVA намерена построить турбины на природном газе для получения ещё 200 МВт, поскольку оператор ещё прошлой осенью не справлялся со спросом.

В TVA заявляют, что задача оператора — работать с партнёрами для привлечения в регион инвестиций и рабочих мест, в каждом случае аккуратно оцениваются детали каждого предложения. MLGW получит из бюджета $760 тыс. для введения в строй ещё 50 МВт, а xAI обязуется построить за $24 млн собственную подстанцию на 150 МВт. Существующие договорённости предусматривают, что xAI будет получать ежемесячные скидки от поставщика энергии, пока не компенсирует стоимость возводимой ей подстанции и та не перейдёт в собственность MLGW.

Постоянный URL: http://servernews.kz/1113750
09.11.2024 [15:32], Руслан Авдеев

AWS вложит $1,3 млрд в расширение ЦОД в Италии

Amazon Web Services (AWS) намерена инвестировать €1,2 млрд ($1,3 млрд) в расширение связанного с дата-центрами бизнеса в Италии. По данным Reuters, средства будут потрачены в течение следующих пяти лет и пойдут на расширение работы ЦОД в Милане. По данным AWS, инвестиции обеспечат до 5,5 тыс. рабочих мест до 2029 года в цепочке поставок ЦОД — в строительстве, обслуживании объектов, проектировании, телеком-сфере, а также в местной экономике в целом.

Дискуссии, связанные с будущими инвестициями AWS, ведутся в Италии как минимум с мая. Компания некоторые время размышляла, расширить кампус ЦОД в Милане или построить новый в Риме. По данным местных СМИ, компания выбрала расширение уже существующего региона. Утверждается, что Италия также может быть использована в качестве базы для предоставления вычислительных мощностей ИИ-проектам в Африки.

 Источник изображения: Tom Podmore/unsplash.com

Источник изображения: Tom Podmore/unsplash.com

Свой первый в Италии облачный регион AWS ввела в эксплуатацию в 2020 году, пообещав инвестировать €2 млрд ($2,2 млрд) в страну к 2029 году. Впрочем, планы у Amazon большие. Она анонсировала намерение инвестировать €15,7 млрд ($17 млрд) в Испании, €7,8 млрд ($8,48 млрд) в Германии и £8 млрд ($10,45 млрд) в Великобритании.

К европейским рынкам демонстрируют неподдельный интерес и другие гиперскейлеры. В октябре Microsoft обязалась вложить €4,3 млрд ($4,75 млрд) в расширение облака и инфраструктуры ИИ ЦОД в Италии.

Постоянный URL: http://servernews.kz/1113752
08.11.2024 [14:27], Руслан Авдеев

В погоне за ИИ: капитальные затраты гиперскейлеров в 2025 году составят $300 млрд

Финансовый гигант Morgan Stanley прогнозирует капитальные затраты гиперскейлеров в 2025 году на уровне $300 млрд. По данным Seeking Alpha, основные затраты придутся на Amazon, Google, Microsoft и Meta, рост расходов связан с повышенными инвестициями в ИИ.

В Morgan Stanley рассчитывают, что Amazon и Microsoft станут лидерами «гонки капиталовложений» и потратят $96,4 млрд и $89,9 млрд соответственно. За ними последуют Google и Meta с $62,6 млрд и $52,3 млрд. Ранее в этом месяце появилась информация о том, что капитальные затраты этих четырёх компаний превысят в 2024 году $200 млрд, рост год к году составит 50 %.

Согласно докладу экспертов Morgan Stanley для инвесторов, Google и Microsoft смогут добиться значительного роста в долгосрочной перспективе благодаря активному использованию ИИ в своих продуктах и услугах, в частности, в поиске и YouTube. Это должно привести к увеличению в ближайшие годы доходов и повышению рыночной стоимости этих компаний.

 Источник изображения: Alvin Mahmudov/unsplash.com

Источник изображения: Alvin Mahmudov/unsplash.com

По словам представителя Morgan Stanley Брайана Новака (Brian Nowak), Amazon, которая, как ожидается, потратит больше всех в 2025 году, за счёт высокой маржинальности бизнеса сможет обеспечивать хороший уровень прибыли, продолжая при этом инвестировать в развитие бизнеса. Облачные технологии, как утверждается, находятся в многолетнем цикле постепенного и устойчивого внедрения.

Хотя гиперскейлеры всё больше делают ставку на ИИ, далеко не все уверены, что такие вложения окупятся. Ранее в этом году исследователи Goldman Sachs предупредили, что крупные технологические компании увеличили капитальные затраты для поддержки развития ИИ-технологий, но до сих пор не продемонстрировали устойчивых бизнес-моделей для возврата инвестиций. По оценкам, в следующие несколько лет на дата-центры, полупроводники, сети и прочую ИИ-инфраструктуру будет потрачено около $1 трлн, но пока непонятно, обеспечит ли это такую финансовую отдачу, на которую надеются инвесторы. Похожего мнения придерживается и Sequoia Capital.

Постоянный URL: http://servernews.kz/1113694

Входит в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности»;

Система Orphus