Материалы по тегу: ии

25.08.2024 [13:10], Сергей Карасёв

Не только ускорители NVIDIA: разметка данных становится одной из основных причин роста стоимости ИИ-моделей

Создание и обучение мощных ИИ-моделей может обходиться компаниям в сотни миллионов и миллиарды долларов в год. Например, OpenAI в 2024-м намерена потратить на эти цели до $7 млрд. Основная часть затрат приходится на аппаратные ресурсы, включая дорогостоящие ускорители NVIDIA. Но, как сообщает Fortune, существует ещё одна важная статья расходов, которая зачастую упускается из виду — необходимость качественной маркировки данных. Между тем именно эта работа требует всё больших финансовых вложений.

Разметка (или маркировка) — процесс идентификации необработанных данных (изображений, текстовых файлов, видео и пр.) и добавления одной или нескольких значимых и информативных меток для обеспечения контекста. Это необходимо для того, чтобы ИИ-модель могла обучаться на таких массивах информации. Разметка данных требуется для различных сценариев использования, включая машинное зрение, обработку естественного языка и распознавание речи.

Разметка уже давно используется, например, при разработке ИИ-моделей для беспилотных автомобилей. Камера фиксирует изображения людей, уличных знаков, транспортных средств и светофоров, а комментаторы-люди помечают снимки такими тегами, как «пешеход», «грузовик» или «знак остановки». Это трудоёмкий и кропотливый процесс, который отнимает много времени и требует значительных финансовых вложений. После выпуска ChatGPT в 2022 году OpenAI подверглась широкой критике за аутсорсинг такой работы: компания наняла кенийских работников менее чем за $2/час.

 Источник изображения: Max Panamá / Unsplash

Источник изображения: Max Panamá / Unsplash

Нынешние универсальные большие языковые модели (LLM) проходят обучение с подкреплением на основе отзывов (RLHF). В ходе процедуры люди предоставляют качественную обратную связь или ранжируют то, что генерирует ИИ-модель. Такой подход приводит к значительному увеличению затрат. Ещё одна причина роста расходов при маркировке данных — желание компаний включить в процесс обучения корпоративную информацию, такую как сведения о клиентах или внутренние корпоративные документы.

Кроме того, маркировка данных экспертного уровня в таких областях, как юриспруденция, финансы и здравоохранение требует привлечения высококвалифицированных специалистов, оплата труда которых стоит весьма дорого. Поэтому некоторые разработчики перекладывают задачи по разметке данных на сторонние компании, например, Scale AI, которая недавно получила финансирование в размере $1 млрд.

Алекс Ратнер (Alex Ratner), генеральный директор стартапа по маркировке данных Snorkel AI, говорит, что корпоративные клиенты могут тратить миллионы долларов на маркировку и обработку информации. Такие операции в некоторых случаях отнимают до 80% времени и бюджета на ИИ. Причём для сохранения актуальности со временем данные должны периодически дополняться и обрабатываться заново.

Таким образом, разметка, наряду с необходимостью применения дорогостоящего оборудования, становится одной из основных статей расходов при обучении ИИ-моделей. Некоторые компании снижают затраты, используя синтетические данные — то есть данные, сгенерированные самим ИИ. Последние инновации в области ИИ сделали генерацию синтетических данных эффективной и быстрой, что в ряде случаев позволяет отказаться от применения массивов реальной информации. Однако в некоторых случаях это грозит «самоповторами».

Постоянный URL: http://servernews.kz/1109968
24.08.2024 [14:21], Руслан Авдеев

Mubadala Investment из Абу-Даби сделала ставку на рынок ЦОД, инвестировав в британскую Yondr Group

Государственный инвестор Mubadala Investment Co. из Объединённых Арабских Эмиратов вложит средства в лондонского строителя и оператора ЦОД Yondr Group. По данным Bloomberg, это новейшая инвестиция одного из фондов национального благосостояния ОАЭ в сектор, который должен выиграть от стремительно растущего спроса на облачные сервисы и ИИ-технологии.

Фонд, ресурсы которого составляют $302 млрд, объявил, что его инвестиции будут способствовать росту Yondr Group, с общей зарезервированной ёмкостью 878 МВт. Подробности сделки не раскрываются, но ранееуже подписал ряд сделок, связанных с рынком ЦОД, в том числе об инвестициях в американскую Aligned Data Centers и сингапурскую Princeton Digital Group (PDG). По мнению экспертов Mubadala Investment, средние темпы прироста глобального совокупного спроса на ЦОД составят 11 % до 2032 года.

 Источник изображения: Nick Fewings/unsplash.com

Источник изображения: Nick Fewings/unsplash.com

Операторы ЦОД довольно давно стали объектом внимания со стороны богатых инфраструктурных инвестиционных фондов. Только в текущем году в сектор инвестировано более $20 млрд. В своём регионе ОАЭ и Саудовская Аравия намерены стать ИИ-хабами в рамках попыток диверсифицировать экономику, пока полагающуюся преимущественно на продажи нефти. В результате началась гонка для строительства на Ближнем Востоке дорогих ЦОД для поддержки технологического развития.

Mubadala Investment вкладывает деньги и в другие проекты, связанные с передовыми технологиями дата-центров. В прошлом году появилась информация о том, что фонд инвестировал в разработчика систем жидкостного охлаждения CoolIT, одного из ключевых игроков рынка СЖО для ЦОД и суперкомпьютеров.

Постоянный URL: http://servernews.kz/1109910
23.08.2024 [16:00], Владимир Мироненко

Китайские компании нашли лазейку в законах США для доступа к передовым ИИ-ускорителям и моделям в облаках AWS и Azure

Государственные китайские организации используют облачные сервисы Amazon, Microsoft и их конкурентов для доступа к передовым американским чипам и технологиям ИИ, пишет Reuters со ссылкой на тендерную документацию, размещённую в общедоступных китайских базах данных. О попытках китайских компаний получить доступ к ИИ-ускорителям на территории США в условиях запрета на их поставки в Китай сообщалось и ранее.

Правительство США ограничивает экспорт высокопроизводительных чипов ИИ в КНР в течение последних двух лет в связи с потенциальной возможностью их использования для укрепления военного потенциала Поднебесной. Однако предоставление доступа к таким чипам или передовым ИИ-моделям в облаках не является нарушением законодательства США, которым регулируется в данном случае только экспорт или передача товара, ПО или технологии, отметило Reuters.

Согласно 50 тендерным документам, с которыми ознакомилось агентство, по крайней мере 11 китайских организаций пытались получить доступ к подпадающим под ограничение технологиям США или облачным сервисам. В четырёх случаях Amazon Web Services (AWS) явно названа поставщиком облачных услуг, хотя компании получили доступ к облачным услугам через посредников, а не напрямую у AWS. Таким образом, не только китайские компании обходят ограничения, но и американские компании извлекают выгоду из растущего в Китае спроса на вычислительные мощности.

 Источник изображения: Mark Daynes / Unsplash

Источник изображения: Mark Daynes / Unsplash

«AWS соблюдает все применимые законы США, включая торговые законы, в отношении предоставления услуг AWS внутри и за пределами Китая», — заявил представитель облачного бизнеса Amazon. По данным Synergy Research Group, AWS контролирует почти треть мирового рынка облачной инфраструктуры. А согласно данным исследовательской компании IDC, AWS является в Китае шестым по величине поставщиком облачных услуг.

«Эта лазейка беспокоит меня уже годы, и нам давно пора её устранить», — заявил агентству Reuters председатель Комитета по иностранным делам Палаты представителей США Майкл Маккол (Michael McCaul), имея в виду удалённый облачный доступ иностранных субъектов к передовым вычислительным решениям США. В апреле в Конгресс США был внесён законопроект, дающий Министерству торговли полномочия регулировать удалённый доступ к технологиям США, но пока неясно, будет ли он принят и когда.

В январе Министерство торговли США также предложило изменения в законодательства с требованием к сервисам облачных вычислений проверять пользователей крупных моделей ИИ и сообщать регулирующим органам об обучения крупных моделей ИИ, способных на «злонамеренную киберактивность». Поправки также дают ведомству право налагать запрет на доступ тех или иных клиентов. Но этот документ всё ещё находится в стадии доработки.

 Источник изображения: Eric Prouzet / Unsplash

Источник изображения: Eric Prouzet / Unsplash

Китайские организации также стремятся получить доступ к облачным сервисам Microsoft. Например, в апреле Сычуаньский университет указал в тендерной документации, что он создаёт платформу генеративного ИИ и закупает 40 млн токенов Microsoft Azure OpenAI. В мае токены поставила компания Sichuan Province Xuedong Technology Co Ltd. В связи с этим OpenAI сообщила Reuters, что её собственные сервисы не поддерживаются в Китае, а сервисы Azure OpenAI работает в соответствии с политикой Microsoft.

Наконец, Институт перспективных исследований Сучжоуского университета науки и технологий Китая (USTC) сообщил в тендерной документации в марте этого года, что хотел бы арендовать 500 облачных серверов с восемью ускорителями NVIDIA A100 в каждом. Согласно апрельским документам, тендер был выполнен компанией Hefei Advanced Computing Center Operation Management Co Ltd, но в них не был указан поставщик облачных услуг, и Reuters не удалось его идентифицировать. USTC был добавлен Минторгом США в чёрный список Entity List в мае этого года из-за получения доступа к американской технологии квантовых вычислений, которая могла бы использоваться военно-промышленным комплексом Китая и помочь в развитии ядерной программы.

Согласно тендерным документам, Amazon предоставляет китайским организациям доступ не только к передовым ИИ-чипам, но и к передовым моделям ИИ, таким как Claude от Anthropic, к которым они не могут получить доступ иным образом, пишет Reuters. Да и сама AWS в сообщениях на китайском языке подчёркивает возможность опробовать «модели ИИ мирового класса» и упоминает китайскую игровую фирму Source Technology как одного из своих клиентов, использующих Claude. После того как Reuters обратилось к Amazon за разъяснением, компания добавила в десятки постов на своих китаеязычных каналах примечание о том, что некоторые из услуг недоступны в китайских облачных регионах. Она также удалила несколько рекламных постов, включая пост об Source Technology.

Постоянный URL: http://servernews.kz/1109914
23.08.2024 [15:00], Владимир Мироненко

США готовят новые ограничения для тех, кто сотрудничает с Китаем в сфере суперкомпьютеров

США намерены ужесточить ограничения для создания в Китае суперкомпьютеров с участием своих граждан, резидентов и компаний, пишет ресурс HPCwire.

В июле был опубликован законопроект, подготовленный Управлением по безопасности инвестиций (Office of Investment Security, OIS), согласно которому гражданам и постоянным резидентам США будет запрещено заниматься деятельностью, связанной с суперкомпьютерами, со странами и территориями, вызывающими обеспокоенность правительства США, к котором причислены Китай, Гонконг и Макао. Они также должны будут сообщать о любых транзакциях, связанных с этой деятельностью.

Проект «Положений, касающихся инвестиций США в определённые технологии и продукты национальной безопасности в странах, вызывающих обеспокоенность», был открыт для обсуждения до 5 августа, но комментарии различных экспертов и организаций поступают до сих пор.

 Источник изображения: Dark Light2021 / Unsplash

Источник изображения: Dark Light2021 / Unsplash

Деятельность в сфере суперкомпьютеров, регулируемая этим законопроектом, «включает разработку, установку, продажу или производство любого суперкомпьютера, оснащённого передовыми интегральными схемами, которые могут обеспечить теоретическую вычислительную мощность от 100 Пфлопс двойной точности (FP64) или от 200 Пфлопс одинарной точности (FP32) объёмом 1178 м3 или меньше». Проще говоря, речь идёт о достаточно высокоплотных HPC-решениях.

Кроме того, граждане и резиденты США будут обязаны информировать правительство об определённых транзакциях, касающихся HPC-сферы, если они занимают должность в иностранной компании, например, партнёра, менеджера или инвестиционного консультанта. Им также вменяется обязанность отслеживать и не допускать проведения иностранными организациями транзакций с Китаем в контексте суперкомпьютеров.

Некоторые представители компьютерной отрасли США восприняли законопроект негативно, заявив, что предлагаемые ограничения являются произвольными. Другим не понравилось расширение государственного надзора, что, как им кажется, задушит инновации в области ИИ. Также утверждается, что закон не учитывает влияние на конкурентоспособность американских технологических компаний на мировом рынке.

 Источник изображения: Ronan Furuta / Unsplash

Источник изображения: Ronan Furuta / Unsplash

В частности, новые правила могут отразиться на производителе ИИ-чипов Cerebras, заключившем партнёрское соглашение о создании девяти ИИ-суперкомпьютеров Condor Galaxy для G42, базирующейся в ОАЭ. Однако, согласно сообщениям, G42 также поставляет технологии в Китай. Это, впрочем, не помешало ей заключить ещё и $1,5-млрд соглашение с Microsoft.

Венчурная компания a16z, которая сама сдаёт ускорители в аренду, обратилась к правительству с просьбой исключить пункт о производительности из регулирования. Она инвестировала в сотни ИИ-стартапов, которым требуется огромная вычислительная мощность. По словам, a16z требования к производительности ИИ-систем стремительно поменялись всего за несколько лет. Поэтому любые ограничения, введённые сейчас, могут очень быстро оказаться неактуальными.

Ассоциация полупроводниковой промышленности (SIA) предупредила, что американские чипмейкеры будут вынуждены уступить свою долю рынка иностранным конкурентам. И в отсутствие инвестиционной активности США в странах, которые вызывают обеспокоенность, появятся зарубежные инвесторы. Это может «подорвать лидерство США и стратегическое преимущество в таких критически важных технологических секторах, как полупроводники, и других стратегических отраслях, которые зависят от полупроводников», — заявила SIA.

 Источник изображения: Kayla Kozlowski / Unsplash

Источник изображения: Kayla Kozlowski / Unsplash

В свою очередь, Национальная ассоциация венчурного капитала (NVCA) сообщила, что предлагаемые правила несут с собой значительное бремя расходов на венчурные инвестиции США по всем направлениям. Расходы на соблюдение правил могут составить до $100 млн/год, что намного больше оценки Министерства финансов США в $10 млн/год. NVCA отметила, что многие стартапы в значительной мере полагаются в своей стратегии на ИИ, и бремя соответствия регуляторным правилам увеличит их расходы на ведение бизнеса и на «каждую из примерно пятнадцати тысяч венчурных инвестиций, сделанных в США».

Также вызывает вопросы расплывчатость списка лиц, которым вменяется в обязанность соблюдать новые правила. Все предыдущие санкции хоть и затормозили, но не помешали созданию китайских суперкомпьютеров, в том числе на чипах собственной разработки. Кроме того, все американские чипмейкеры после очередного введения ограничений корректировали спецификации своих продуктов, чтобы не лишаться крупного и важного для них рынка Китая.

Постоянный URL: http://servernews.kz/1109906
23.08.2024 [14:19], Руслан Авдеев

Принадлежащая Indosat индонезийская Lintasarta запустила ИИ-облако Merdeka на базе решений NVIDIA

Занимающаяся IT-услугами индонезийская компания Lintasarta запустила облачный ИИ-сервис GPU Merdeka. По данным Datacenter Dynamics, бизнес принадлежит Indosat и будет предлагать услуги в формате GPU-as-a-Service (GPUaaS). Ранее в этом году было объявлено, что NVIDIA и Indosat построят в Индонезии ИИ ЦОД стоимостью $200 млн в Суракарте (Surakarta).

Речь идёт о суверенном ИИ-облаке на основе серверов с восемью NVIDIA H100 (SXM). Сам ЦОД поддерживает до 20 кВт на стойку. Как заявляют в Indosat, благодаря знаковому партнёрству с NVIDIA, компания намерена демократизировать доступ к облачным ИИ-сервисам, сделав соответствующие услуги более доступными в Индонезии и соседних странах. Также компания намерена ускорить рост индонезийской цифровой экономики.

 Источник изображения: Harry Kessell/unsplash.com

Источник изображения: Harry Kessell/unsplash.com

Облако Merdeka, по словам Lintasarta, является важной вехой на пути превращения в специализирующуюся на ИИ технологическую компанию. Ожидается, что технологии и опыт Lintasarta помогут стране в достижении целей стратегии 2045 Golden Indonesia Vision.

IT-система страны нуждается в модернизации. Совсем недавно хакеры заблокировали правительственный ЦОД в стране, потребовав за ключ дешифровки $80 млн, из-за чего нарушилась работа государственных и медицинских учреждений, транспортной инфраструктуры и т.п. Выяснилось, что резервных копий почти никто не делал. В конце концов злоумышленники бесплатно прислали ключ и извинились, но репутация страны в области IT оказалась подпорчена. При этом соседняя Малайзия стремительно наращивает компетенции в области ЦОД и ИИ, намереваясь стать региональным IT-лидером.

Постоянный URL: http://servernews.kz/1109903
23.08.2024 [08:17], Руслан Авдеев

Гиперскейлеры стремительно застраивают США дата-центрами для ИИ

Согласно исследованию CBRE, количество строящихся дата-центров стремительно растёт из-за бума ИИ-систем, передаёт The Register. При этом, как сообщается в докладе, на ведущих рынках Северной Америки за последний год рост составил около 70 %, достигнув рекордных 3,87 ГВт. В числе самых быстрорастущих регионов — Атланта, где объёмы строительства ЦОД выросли на 76 % год к году до примерно 1,3 ГВт. В Техасе (Остине и Сан-Антонио) строится 463 МВт новой ёмкости ЦОД, вчетверо с лишним больше, чем годом ранее.

Быстрая экспансия сдерживается недостатком доступной ЦОД электроэнергии и длительным временем создания критической инфраструктуры, необходимой для ввода объектов в эксплуатацию. Впрочем, даже когда эти объекты заработают, только около 20 % их ресурсов будут доступны обычным пользователям, порядка 80 % на 3,87 ГВт уже зарезервировано гиперскейлерами, облачными провайдерами и операторами ЦОД, сдающими ИИ-ускорители в аренду.

В CBRE сообщают, что ёмкость ЦОД на ключевых рынках в I половине 2024 года выросла на 10 %, объекты на 1,1 ГВт заработали в прошлом году. Однако доступность ёмкостей всё равно ограничена, поскольку в среднем в указанных регионах свободны всего 2,8 % ресурсов. Впрочем, при желании можно обратиться к менее популярным территориям вроде Центрального Вашингтона, Миннеаполиса, Хьюстона или Денвера, поскольку на второстепенных рынках Северной Америки свободны 10 %.

 Источник изображения: CBRE

Источник изображения: CBRE

Недостаток новых ЦОД и высокий спрос ведёт к росту цен, хотя не такому быстрому, как в прошлом году. Средний ежемесячный запрос составляет 250–500 кВт на ключевых рынках, рост в I квартале 2024 года составил 7 % до $174/кВт в месяц. Арендная плата, как ожидается, продолжит расти и во II полугодии, во многом из-за роста стоимости строительства и оборудования. Тенденция также обусловлена и использованием более ресурсоёмких ИИ-ускорителей. Например, потребление одного ускорителя NVIDIA Blackwell может достигать 1200 Вт, он изначально рассчитан на использование СЖО.

По мнению экспертов CBRE, в результате строительство новых ЦОД будет только дорожать. С другой стороны, менее требовательным пользователям могут стать более доступными плохо оснащённые старые дата-центры, не готовые для работы с современными ускорителями. Прогнозируется, что второстепенные рынки в Северной Индиане, Айдахо, Арканзасе и Канзасе благодаря обилию дешёвой земли и энергии могут стать новыми центрами развития ЦОД.

 Источник изображения: CBRE

Источник изображения: CBRE

Что касается энергии, то дефицит трансформаторов, переключателей и генераторов продолжится ещё четыре года, что не может не сказаться на времени строительства дата-центров. В CBRE отмечают, что клиенты, желающие получить требуемую ёмкость в срок, должны заключать соглашения за 2–4 года до предполагаемого ввода объектов в эксплуатацию.

Постоянный URL: http://servernews.kz/1109852
22.08.2024 [23:31], Владимир Мироненко

Microsoft изменила отчётность, чтобы полнее отражать вклад ИИ в финансовые результаты

Microsoft изменила принцип формирования отчётности своих бизнес-подразделений, в связи с чем часть доходов от поиска и новостной рекламы теперь отражается в финансовых результатах подразделения облачных вычислений Azure. Microsoft объяснила изменения стремлением дать инвесторам более чёткое представление о вкладе ИИ в работу компании, пишет Reuters.

Вместе с тем доходы от услуг ИИ и речевых технологий, которые предлагает подразделение Nuance, теперь будут относиться к сегменту Productivity and Business Processes (офисные приложения Office и Office 365, Dynamics CRM) вместо сегмента Intelligent Cloud, включающего облачные сервисы, а также Enterprise Services, Windows Server и SQL Server.

 Источник изображения: Pixabay

Источник изображения: Pixabay

В компании сообщили, что изменения позволят привести структуру отчётности в соответствие с тем, как управляется её бизнес. Компания уже откорректировала показатели выручки по подразделениям за последний финансовый год и пересмотрела свой прогноз на квартал с июля по сентябрь. Microsoft — одна из немногих крупных технологических компаний, которая отдельно сообщает о вкладе ИИ в своей выручке, поскольку большинство компаний ещё не увидели большого прироста от инвестиций в ИИ.

В прошлом месяце компания сообщила, что ИИ обеспечил большее влияние на рост показателей Azure в последнем квартале, несмотря на общее замедление бизнеса. Также Microsoft ожидает ускорение роста показателей Azure во II половине 2025 финансового года. Согласно обновлённому прогнозу, в I квартале 2025 финансового года подразделение Intelligent Cloud получит выручку в пределах от $23,80 млрд до $24,10 млрд по сравнению с предыдущим прогнозам в размере $28,6–$28,9 млрд. Ожидаемый доход подразделения Productivity and Business Processes в I квартале находится в диапазоне от $27,75 до $28,05 млрд по сравнению с предыдущим прогнозом в пределах от $20,3 до $20,6 млрд.

Постоянный URL: http://servernews.kz/1109866
22.08.2024 [18:15], Елена Копытова

Lambda Labs и SK Telecom построят крупнейший в Южной Корее облачный ИИ-кластер

Стартап Lambda Labs, специализирующийся на предоставлении в аренду облачных ИИ-мощностей, заключил партнёрство с крупнейшей южнокорейской телекоммуникационной компанией SK Telecom (SKT), пишет DataCentre Dynamics. В рамках сотрудничества SK Telecom до конца года развернёт облачную ИИ-платформу Lambda AI Cloud в дата-центре SK Broadband в Касане (Gasan). Со временем планируется разместить в ЦОД тысячи ускорителей.

«SKT разделяет наше видение того, как сделать GPU-вычисления такими же повсеместными, как электричество», — говорит генеральный директор и соучредитель Lambda Стивен Балабан (Stephen Balaban). «Учитывая быстрый темп инноваций в области ИИ, происходящих в Южной Корее, мы рады сотрудничать с SKT в их миссии по превращению своей компании и страны в глобальную ИИ-державу».

ЦОД в Касане был запущен в 2021 году. На тот момент он имел ёмкость 46 МВт и площадь 69,3 тыс. м². SKT говорит, что сейчас площадка предлагает до 44 кВт на стойку. SK Broadband также управляет дата-центрами в Сочхо (Seocho), Илсане (Ilsan) и Пундангу (Bundang). «Мы построим крупнейший в Корее кластер ускорителей, чтобы повысить конкурентоспособность национального ИИ, и выйдем на мировой рынок», — сказал Ким Кён Док (Kim Kyeong Deog), вице-президент и глава корпоративного подразделения SK Telecom.

 Источник изображения: Lambda Labs

Источник изображения: Lambda Labs

Какие именно ускорители будут использоваться в ИИ-облаке, не уточняется, хотя Lambda традиционно полагается на чипы NVIDIA. SK Group владеет долями в южнокорейских разработчиках ИИ-ускорителей Sapeon и Rebellions, которые объединятся под началом SK, чтобы вместе противостоять NVIDIA. В свою очередь в прошлом месяце SKT объявила об инвестировании $200 млн в американскую компанию Smart Global Holdings (Penguin Solutions), которая занимается ИИ- и HPC-инфраструктурой. А для Lambda сотрудничество с SKT стало первым за пределами Северной Америки, где компания управляет двумя ЦОД.

Постоянный URL: http://servernews.kz/1109851
22.08.2024 [09:23], Руслан Авдеев

ЦОД в Вирджинии потребляют огромные объёмы питьевой воды, а развитие ИИ только усугубляет ситуацию

Озабоченность экоактивистов вероятным воздействием ЦОД на природу штата Вирджиния (США) стала ещё серьёзнее. Financial Times сообщает, что потребление воды дата-центрами выросло почти на ⅔ в сравнении с 2019 годом, а рост спроса на ИИ только ухудшает положение.

Северная Вирджиния давно считается мировой столицей ЦОД, там работает порядка 300 соответствующих объектов. По данным Financial Times, за последние пять лет потребление воды в некоторых округах выросло почти на ⅔ — соответствующие данные были собраны энтузиастами благодаря законам о свободе информации, передаёт The Register. Около 7 млн м3 воды было использовано в 2023 году, тогда как в 2019 году — около 4,3 млн м3. В ЦОД вода используется в основном для охлаждения.

В обозримом будущем ожидается рост расхода воды, связанный с ИИ, поскольку соответствующее оборудование потребляет всё больше энергии и работает безостановочно. Так, на одну беседу с ChatGPT уходит примерно поллитра воды. При этом некоторые ЦОД находятся в регионах с дефицитом питьевой воды — даже части Вирджинии страдают от засух. Более того, во время засух и жаркой погоды дата-центрам требуется больше воды, чем обычно.

 Источник изображения: Jack B/unspalsh.com

Источник изображения: Jack B/unspalsh.com

Хотя именно в Вирджинии, согласно данным Northern Virginia Technology Council, с 2015 по 2023 гг. ёмкость объектов увеличилась в пять раз. Экоактивисты, политики и просто неравнодушные граждане, обеспокоенные тем, что ЦОД занимают всё больше земли и тратят всё больше энергии и воды, сформировали НКО Virginia Data Center Reform Coalition в попытке остановить бесконтрольный рост дата-центров в штате.

Так, в одном из отчётов заявляется, что ЦОД, обслуживаемые коммунальными службами только в округе Лаудон (Loudoun) Северной Вирджинии, увеличили использование питьевой воды более чем на 250 % с 2019 по 2023 гг. Впрочем, представитель компании Aquatech заявил, что большинство ЦОД в округе используют переработанные сточные воды, которые иначе просто слили бы в Чесапикский залив, а многие новые ЦОД вообще не забирают воду для охлаждения.

Крупнейшие операторы вроде AWS берут на себя обязательства по снижению потребления воды, компания ещё в 2022 году анонсировала намерение стать «водно-положительной» к 2030 году. Впрочем, в Microsoft, наоборот, признали, что в прошлом году потребление воды на её объектах выросло на треть — виной тому именно развитие генеративных ИИ-систем. Дефицит водных ресурсов наблюдается и в других регионах. Так, британская Thames Water пригрозила урезать подачу воды дата-центрам или взвинтить цены.

Постоянный URL: http://servernews.kz/1109708
22.08.2024 [00:13], Руслан Авдеев

Alibaba и Tencent отметили стабилизацию спроса на облачные CPU и рост спроса на ИИ-ускорители

Спрос на CPU-мощности в ключевых китайских облаках Alibaba Cloud и Tencent Cloud выровнялся и теперь клиентов больше интересуют ИИ-ускорители, сообщает The Register. Рост спроса на предложения, связанные с ИИ, зарегистрировала и Lenovo.

На прошлой неделе Alibaba и Tencent опубликовали квартальную отчётность, выручка Alibaba Cloud выросла год к году на 6 % до $3,7 млрд. Tencent не раскрывает показатели гиперскейл-сегмента, но отмечает рост спроса на облачные сервисы, благодаря чему квартальные показатели подразделения Business Services выросли год к году на «десятки процентов».

Представитель Tencent объявил инвесторам, что бизнес по аренде ИИ-ускорителей переживает настоящий бум. Впрочем, абсолютные показатели достаточно скромные в сравнении с американским рынком, поскольку у КНР меньше хорошо финансируемых ИИ-стартапов. По некоторым данным, местные стартапы часто располагают $1–$2 млрд, тогда как в США объём инвестиций может достигать и $10–$90 млрд. Tencent в любом случае не теряет клиентов даже на фоне замещения CPU на GPU.

В Alibaba сообщают, что спрос на ИИ-продукты и связанные технологии очень большой, причём он всё ещё далёк от удовлетворения. Для Alibaba Cloud во II половине 2024 года прогнозируется двузначный рост в процентах и большая часть выручки придётся на ИИ-продукты. При этом в Alibaba констатируют, что спрос на традиционные вычисления в облаке на базе классических процессоров ограничен, большая часть роста связана именно с ИИ-продуктами на основе ускорителей.

 Источник изображения:  Growtika/unsplash.com

Источник изображения: Growtika/unsplash.com

В Lenovo тоже сообщили, что в подразделении Infrastructure Solutions Group (ISG) зарегистрирован рекордный рост выручки до $3,2 млрд — это на 65 % выше год к году, частично благодаря спросу на ИИ-решения, причём и на базе обычных серверов, и на базе систем с ИИ-ускорителями. Инвесторам объявили, что оживлённые вложения в ИИ-инфраструктуру и улучшение поставок ускорителей помогут компании вырасти.

Пока же ISG отчиталась о квартальных убытках в объёме $37 млн. Впрочем, это лучше, чем $60,4 млн убытков в аналогичном квартале прошлого года и $97 млн в прошлом квартале. В ходе отчёта экспертов заинтересовало, почему рост выручки на 65 % не привёл к прибыльности соответствующего бизнеса. В самой компании обещают дальнейшую оптимизацию бизнеса в соответствии с требованиями эры гибридных и ИИ-вычислений. Другими словами, не исключены увольнения и/или сокращение продуктовых линеек.

Постоянный URL: http://servernews.kz/1109761
Система Orphus