Материалы по тегу: облако

19.05.2025 [14:48], Владимир Мироненко

HPE предложила клиентам VMware новые решения с Morpheus VM Essentials

Компания Hewlett Packard Enterprise (HPE) объявила о новых предложениях, направленных на упрощение модернизации гибридных ИТ-решений, а также повышение киберустойчивости, доступности данных и энергоэффективности для клиентов, использующих хранилища.

В августе прошлого года HPE завершила приобретение создателя облачной платформы управления Morpheus Data, который поставлял ПО, используемое в подписных предложениях HPE GreenLake. Компания объединила функции Morpheus со своим собственным предложением виртуализации на основе KVM для создания VM Essentials в стремлении привлечь клиентов VMware, недовольных политикой Broadcom. Решение может работать автономно или на собственных системах HPE и позволяет управлять не только виртуальными машинами HPE, но и традиционными (VMware) ВМ.

 Источник изображений: HPE

Источник изображений: HPE

Следующим шагом стало объявление об интеграции HPE Morpheus VM Essentials с HPE Private Cloud Business Edition, что позволяет снизить до 90 % стоимость лицензий на ВМ с поддержкой нескольких гипервизоров и самостоятельным потреблением облачных ресурсов. Эта экономия добавляется к предполагаемому снижению совокупной стоимости владения (TCO) в 2,5 раза, обеспечиваемому дезагрегированной гиперконвергентной инфраструктурой (dHCI). HPE Private Cloud Business Edition, доступная в формате dHCI или HCI, предоставляет организациям гибкость в выборе оптимальной архитектуры для рабочих нагрузок ВМ как на периферии, так и в ЦОД, говорит HPE.

Семейство ПО HPE Morpheus, включающее решения HPE Morpheus VM Essentials для виртуализированных рабочих нагрузок и HPE Morpheus Enterprise Software для унифицированного управления облаками, теперь находится в открытом доступе. Обе версии включают гипервизор HVM от HPE и лицензируются по сокетам для снижения совокупной стоимости владения. Клиенты VM Essentials также смогут перейти на полную версию HPE Morpheus Enterprise.

Как сообщает компания, решение VM Essentials разработано для глобального развёртывания и поддерживается комплексными корпоративными службами, охватывающими всё, от инфраструктуры до рабочих нагрузок. При этом используется ИИ на всех этапах — от настройки до эксплуатации. С его помощью HPE автоматизирует настройку инфраструктуры и управление жизненным циклом платформы Business Edition. Возможности AIOps позволяют прогнозировать и предотвращать до 86 % операционных проблем, высвобождая ИТ-ресурсы, а также повышая производительность и надежность.

Ресурс Blocks & Files отметил, что софт Morpheus Enterprise позволяет ИТ-отделу клиента стать внутренним поставщиком ИТ-услуг. Он имеет графический интерфейс и API, поддерживает подход инфраструктура-как-код или подключаемые модули ITSM, и позволяет управлять как собственными средами KVM и Kubernetes HPE, так и другими приложениями на физическом, локальном и публичном облачных ресурсах.

Продукт не зависит от гипервизора, оборудования и облака и интегрируется с окружающими наборами инструментов, такими как ServiceNow, DNS, системами резервного копирования и инструментами оркестрации задач для сквозного управления зависимостями приложений (end-to-end). HPE утверждает, что он ускоряет подготовку нагрузок до 150 раз, сокращает расходы на облако до 30 % и снижает риски за счёт детального управления доступом на основе ролей (RBAC). Commvault станет первым партнером экосистемы VM Essentials, который будет поддерживать резервное копирование и восстановление виртуальных машин на основе образов с предстоящим релизом в мае.

Morpheus Enterprise и VM Essentials недавно были протестированы для работы на серверах Dell PowerEdge и массивах NetApp AFF, а также на серверах HPE ProLiant Compute Gen11 и Gen12. По данным HPE, комбинация VM Essentials и HPE Aruba Networking CX 10000 снижает совокупную стоимость владения до 48 %, увеличивает производительность до 10 раз, обеспечивает микросегментацию, ускорение благодаря DPU и повышенную безопасность. VM Essentials также обеспечивает простое, детализированное управление хранилищем HPE Alletra Storage MP B10000.

HPE Advisory and Professional Services также теперь предлагает услуги модернизации виртуализации с аналитикой затрат, инструментами миграции, схемами оркестрации и интеграцией конвейера DevOps. HPE Services предоставляет специализированную оценку, комплексный процесс для создания надёжных зон посадки, а также услуги по перенастройке рабочих нагрузок, модернизации инфраструктуры, миграции данных, обучению членов команды и управлению инфраструктурой для снижения накладных расходов.

ПО Morpheus Enterprise уже доступно как отдельное ПО и в составе HPE Private Cloud Business Edition с Morpheus VM Essentials. Новые системы Business Edition с HPE SimpliVity будут доступны в III квартале. Интеграция ПО Morpheus для Alletra Storage MP B10000 доступна уже сейчас, для HPE Aruba Networking CX 10000 — в июне.

Постоянный URL: http://servernews.kz/1123046
19.05.2025 [11:29], Сергей Карасёв

ИИ-облако TensorWave с ускорителями AMD получило ещё $100 млн, в том числе от самой AMD

Компания TensorWave, создающая облачную ИИ-платформу на ускорителях AMD, объявила о проведении раунда финансирования Series A, в ходе которого получено $100 млн. Инвестиционную программу возглавили Magnetar и AMD Ventures при участии Maverick Silicon, Nexus Venture Partners и Prosperity7.

В апреле 2024 года TensorWave начала развёртывание облачной ИИ-системы с ускорителями Instinct MI300X. Кроме того, внедряются решения Instinct MI325X. Платформа TensorWave предполагает применение прямого жидкостного охлаждения (DLC) и высокопроизводительного хранилища. Утверждается, что при решении определённых задач, таких как запуск крупных ИИ-моделей в FP16-формате, ускорители AMD обеспечивают преимущества перед изделиями NVIDIA благодаря большему объёму памяти. В результате, ускоряется внедрение сервисов и снижается стоимость услуг для заказчиков.

В конце прошлого года стартап TensorWave привлёк $43 млн на закупку ускорителей AMD. В раунде финансирования приняли участие Maverick Capital, Translink Capital, Javelin Venture Partners, Granite Partners и AMD Ventures. Новое финансирование в размере $100 млн по срокам совпало с развёртыванием 8192 ускорителей Instinct MI325X для ИИ-кластера в дата-центре в Тусоне (Аризона, США).

 Источник изображения: TensorWave

Источник изображения: TensorWave

Полученные средства, как ожидается, будут способствовать развитию бизнеса TensorWave, расширению штата и ускорению создания облачной платформы на базе Instinct MI325X. Рынок инфраструктуры ИИ переживает беспрецедентный рост: по оценкам, к 2027 году затраты в данном секторе превысят $400 млрд. Аналитическая фирма Fortune Business Insights подсчитала, что объём мирового рынка ИИ в целом в 2024 году достиг $233 млрд. Прогнозируется, что показатель увеличится примерно до $1,7 трлн долларов к 2032 году.

«Финансирование в размере $100 млн поддерживает миссию TensorWave по демократизации доступа к передовым вычислительным ресурсам. Кластер из 8192 ускорителей Instinct MI325X — это только начало», — сказал Даррик Хортон (Darrick Horton), генеральный директор TensorWave.

Постоянный URL: http://servernews.kz/1123042
16.05.2025 [13:10], Сергей Карасёв

Synology выпустила NAS BeeStation Plus для создания персонального облачного хранилища

Компания Synology анонсировала «настольное» устройство BeeStation Plus, на базе которого может быть сформировано персональное облачное хранилище для небольших рабочих групп. Новинка представляет собой альтернативу публичным облакам, не требуя регулярной оплаты подписки, говорит компания.

В основу BeeStation Plus положен процессор Intel Celeron J4125 поколения Gemini Lake Refresh (4C/4T; 2,0–2,7 ГГц). Объём оперативной памяти DDR4 составляет 4 Гбайт без возможности расширения. В оснащение изначально включён жёсткий диск Synology HAT3310 формата LFF вместимостью 8 Тбайт со скоростью вращения шпинделя 7200 об/мин.

Устройство располагает сетевым портом 1GbE RJ45, интерфейсами USB Type-A 3.2 Gen1 и USB Type-C 3.2 Gen1. BeeStation не имеет адаптера Wi-Fi. При этом USB-порты предназначены исключительно для подсоединения внешних накопителей. Габариты составляют 148,0 × 62,6 × 196,3 мм, масса — 1,2 кг. Задействована система активного охлаждения с вентилятором и уровнем шума примерно 21 дБА при обычной нагрузке. Диапазон рабочих температур — от 0 до +40 °C. Энергопотребление — 14,75 Вт.

 Источник изображения: Synology

Источник изображения: Synology

Платформа BeeStation Plus, как отмечает Synology, объединяет облачные сервисы, такие как Google Drive, Dropbox и OneDrive, а также внешние накопители и файлы компьютера в одном интеллектуальном рабочем пространстве. Устройство автоматически выполняет резервное копирование и синхронизацию данных со смартфона и ПК. Дополнительно можно воспользоваться сервисом BeeProtect, который позволяет выполнять резервное копирование библиотеки BeeStation Plus в облако. Осуществлять настройку системы можно через браузер на компьютере или смартфоне.

Постоянный URL: http://servernews.kz/1122927
15.05.2025 [12:02], Руслан Авдеев

Oracle выделит $14 млрд на развитие ИИ и облака в Саудовской Аравии

Компания Oracle намерена инвестировать в расширение облачных ИИ-сервисов в Саудовской Аравии $14 млрд в течение следующих 10 лет, сообщает Datacenter Dynamics. Как заявила генеральный директор Oracle Сафра Кац (Safra Catz), Oracle поставляет Саудовской Аравии передовые облачные и ИИ-технологии «благодаря решительным действиям и сильному руководству президента и его администрации».

По мнению Кац, партнёрство со страной создаст новые возможности для её экономики, обеспечит прогресс в области здравоохранения и укрепит союз с Соединёнными штатами — это, как ожидается, создаст «волновой эффект мира и процветания» на Ближнем Востоке и в мире в целом, сообщает пресс-служба компании.

Подробности инвестиций не называются. У Oracle уже есть в Саудовской Аравии два облачных региона: Saudi Arabia West расположен в Джидде (Jeddah), Saudi Arabia Central — в Эр-Рияде (Riyadh) в ЦОД Center3. Первый из них запустили ещё в 2020 году, а второй, размещённый — в 2024-м. С октября 2021 года Oracle планирует создать третий регион в высокотехнологичном городе Неом (Neom), но пока на сайте Oracle регион остаётся в статусе «скоро».

 Источник изображения: Rabah Al Shammary/unsplash.com

Источник изображения: Rabah Al Shammary/unsplash.com

Новое обязательство компания приняла вскоре после того, как Oracle пообещала пятикратно увеличить инвестиции в Абу-Даби (Abu Dhabi, ОАЭ). Всего Oracle распоряжается пятью действующими облачными регионами на Ближнем Востоке и в соседней Северной Африке, ещё четыре находятся в стадии строительства. Совсем недавно США отменили спорные ограничения на экспорт ИИ-ускорителей в другие страны, поэтому сотрудничество с Ближним Востоком обещает стать намного более плодотворным.

Постоянный URL: http://servernews.kz/1122855
14.05.2025 [23:27], Руслан Авдеев

США отменили спорные ограничения на экспорт ИИ-ускорителей в другие страны, но запретили им покупать ускорители Huawei

Вызвавшие немало споров «Правила распространения ИИ» (AI Diffusion rules), которые должны были ограничить продажу американских ускорителей уже на этой неделе, официально отменены президентом США Дональдом Трампом (Donald Trump), сообщает The Register.

Министерство торговли США выполнило данное ранее обещание отменить экспортный контроль для большинства стран на том основании, что он «подавлял бы американские инновации и обременял бы компании новыми нормативными требованиями». В заявлении министерства также подчёркивалось, что новые правила подорвали бы дипломатические отношения Соединённых Штатов с десятками стран.

Рамочную программу опубликовали в последние дни правления администрации Байдена — она была направлена на ограничение продаж ИИ-чипов буквально большинству стран мира, за исключением нескольких избранных союзников — в число счастливчиков не вошли даже многие страны НАТО. Предполагалось, что новые ограничения заставят «пострадавшие» страны серьёзно относиться к контролю возможного реэкспорта или контрабанды ИИ-чипов и оборудования в недружественные страны.

 Источник изображения: Greg Bulla / Unsplash

Источник изображения: Greg Bulla / Unsplash

Хотя некоторые приветствовали ограничения, многие американские технологические компании выступили резко против новых правил, заявив, что страны, не получив ИИ-инфраструктуру от США, смогут получить её от Китая. В администрации Трампа разрабатывают собственный подход. Политики обещают защитить национальные интересы США, но подробностей пока очень мало.

Ранее Министерство торговли также выпустило документ, в котором предупредило об опасностях IaaS — многие компании закрывают глаза на то, что китайские разработчики ИИ-моделей работают со своими проектами в их облаках. Хотя покупать передовые чипы структурам из КНР давно запрещено, им никто не мешает арендовать ИИ-инфраструктуру, в том числе в США.

Во вторник Бюро промышленности и безопасности (BIS) Министерства торговли США также выпустило разъяснение к Правилам экспортного контроля (EAR), в котором предупредило, что производители чипов могут подпадать под экспортные ограничения при продажах иностранным облачным провайдерам. В этих правилах уже предусмотрен запрет гражданам США, а также поставщикам облачных услуг и операторам ЦОД без разрешения и сознательно предоставлять сервисы или заключать контракты, которые будут способствовать разработке ИИ-решений недружественным странами для целей военной разведки или создания оружия.

 Источник изображения: Dario Daniel Silva / Unsplash

Источник изображения: Dario Daniel Silva / Unsplash

В частности, в разъяснении указывается, что производителям также потребуется разрешение США на продажу чипов иностранным IaaS-провайдерам, если известно, что ускорители могут использоваться противниками США. Фактически поставщикам напомнили, что если таких провайдеров поймают на помощи в обучении моделей для китайских военных, за этим последует суровое наказание. Более того, США ужесточают контроль не только над новыми чипами для ИИ, но и над теми, что уже есть у иностранных компаний, если они могут быть использованы для разработки «враждебного» ИИ.

Наконец, в BIS зашли настолько далеко, что ограничили использование в любой точке мира ускорителей Huawei — наиболее производительной альтернативы чипам NVIDIA в Китае, поскольку, якобы, есть высокая вероятность того, что такие чипы сделаны с использованием американских технологий, но без лицензии.

Постоянный URL: http://servernews.kz/1122795
14.05.2025 [10:18], Руслан Авдеев

Окно в облака: Microsoft подготовила виртуальный тур по дата-центру компании

Microsoft создала специальный сайт, на котором любой желающий может принять участие в виртуальном туре по ЦОД, сообщает пресс-служба компании. Посетители смогут узнать особенности устройства дата-центров: от собственно зданий до серверов, сетей, ИИ-инфраструктуры и т.п. Virtual Datacenter Tour знакомит с дизайном, стоящим за более чем 300 ЦОД компании по всему миру.

Инфраструктура ЦОД касается едва ли не каждой сферы современной жизни, от онлайн-банкинга до удалённой работы, видеозвонков, социальных сетей и многого другого. ЦОД стоят за облаками, позволяя клиентам обходиться, полностью или частично, без собственных программно-аппаратных комплексов. Облака объединяют миллионы серверов и виртуальных машин, хранят данные и приложения, а также обеспечивают пользователей контентом и сервисами.

 Источник изображения: Microsoft

Источник изображения: Microsoft

ЦОД Microsoft вмещают тысячи серверов, включая резервные системы, и присутствие компании на рынке расширяется. Поскольку реальные экскурсии по ЦОД для большинства граждан запрещены по соображениям безопасности (за некоторыми забавными исключениями), в Microsoft организовали виртуальную 3D-копию дата-центра. При этом пользователи смогут воспользоваться ИИ-ботов, чтобы получить дополнительную информацию.

 Источник изображения: Microsoft

Источник изображения: Microsoft

Экскурсия доступна как владельцам компьютеров, так и мобильных устройств. Сайт регулярно пополняется новыми «помещениями» и контентом. Виртуальный ассистент, предоставляемый сервисом Azure Open AI, специально создан для ответов на многие вопросы по теме: об экоустойчивости Microsoft Cloud, технологиях охлаждения, системах безопасности, обеспечения надёжности работы и т. п.

Можно посетить виртуальную серверную и ознакомиться с новейшим оборудованием и комплектующими, вроде разработанных дома CPU Azure Cobalt или кастомных ИИ-ускорителей Azure Maia. Впрочем, в Azure доступны и решения других компаний-партнёров. Любознательные посетители смогут ознакомиться с электрооборудованием, включая аккумуляторы и резервные генераторы, и т.п.

Постоянный URL: http://servernews.kz/1122730
09.05.2025 [12:31], Руслан Авдеев

AWS вложит $4 млрд в создание облачного региона в Чили

Amazon Web Services (AWS) намерена инвестировать в создание облачного региона в Чили $4 млрд до конца 2026 года. Вложения поддержат строительство, подключение к коммуникациям, а также непосредственно работу и обслуживание ЦОД в стране, сообщает Datacenter Dynamics. На момент запуска регион будет иметь три зоны доступности. Сейчас у компании есть 114 зон в 36 регионах мира.

AWS объявила, что дата-центры в Чили в основном будут использовать гибридный фрикулинг, вода будет применяться в системах охлаждения лишь пару недель в году. Кластер AWS South America (Chile) Region поможет удовлетворить растущий спрос на облачные сервисы в Латинской Америке. С новым регионом организации смогут использовать передовые технологии AWS, в том числе ИИ и машинное обучение. Инвестируя в местные кадры и образовательные программы, компания будет способствовать росту экономики страны и её цифровой трансформации, говорится в сообщении AWS.

 Источник изображения: Caio Silva/unsplash.com

Источник изображения: Caio Silva/unsplash.com

По словам представителя чилийских властей, расширение инфраструктуры AWS в Чили — очевидный образец приверженности компании к развитию передовых технологий и инноваций. Кроме того, это показывает, какая работа проделана для того, чтобы создать в латиноамериканском государстве среду, в которой могут процветать технологические компании, в частности, в рамках реализации проекта National Data Center Plan.

Как сообщает пресс-служба компании, впервые AWS заявила о себе в Чили, реализовав в стране периферийную платформу CloudFront Edge в 2019 году. Позже компания запустила сервис AWS Ground Station в Пунта-Аренасе (Punta Arenas), а также предложила локальные частные облака AWS Outposts в 2021 году. В 2023 году она организовала в стране шлюз AWS Direct Connect, а также запустила локальную зону (Local Zone) в Сантьяго.

Компания рассматривала строительство дата-центров в Чили как минимум с 2017 года. В январе 2024 года она получила «зелёный свет» на реализацию в Сантьяго проекта ЦОД стоимостью $205 млн. В июле того же года она получила разрешение на строительство второго дата-центра в городе, на который должно быть выделено ещё $205 млн. В прошлом году из-за засухи у строителей ЦОД в стране возникли проблемы. Так, местное правительство пересмотрело разрешение на строительство в Сантьяго ЦОД за $200 млн.

Постоянный URL: http://servernews.kz/1122559
07.05.2025 [16:22], Руслан Авдеев

Roblox развернёт новый ЦОД в Сан-Паулу в 2026 году

Roblox Corporation, стоящая за популярной видеоигровой платформой, начала строить ЦОД в Сан-Паулу (Бразилия), сообщает Datacenter Dynamics. Новый ЦОД заработает в начале 2026 года. Он расширит возможности миллионов пользователей в Бразилии — производительность повысится, а задержка сократится задержка.

Дата-центр получит передовое оборудование. Впрочем, технических подробностей пока немного. В комментариях на сайте DevForum сообщается, что Roblox испытывает серверы в Бразилии с 2024 года, но косвенные признаки свидетельствуют о том, что речь может идти о строительстве объекта с нуля. Платформа готовится принять ещё миллионы человек — Бразилия невероятно важна для неё.

 Источник изображения: Oberon Copeland @veryinformed.com/unsplash.com

Источник изображения: Oberon Copeland @veryinformed.com/unsplash.com

Roblox распоряжается 27 дата-центрами, большинство из которых находятся в США. Большинство сервисов под управлением Roblox Cloud размещаются в ЦОД, управляемых самой Roblox. Часть дата-центров напрямую связана друг с другом широкополосными магистральными каналами связи, минующими общедоступный интернет. Некоторые базы данных, объектные хранилища и иные сервисы размещены в AWS.

Почти все серверы, ответственные за моделирование виртуальных сред и оптимизацию ресурсов для клиентов Roblox, принадлежат самой компании и работают в ЦОД, в том числе периферийных, которые разбросаны по 23 городам Северной Америки, Азиатско-Тихоокеанского региона и Европы. На 31 декабря 2024 года облако Roblox использовало 140 тыс. серверов.

В конце апреля сообщалось, что в Бразилии может появиться новый дата-центр TikTok китайской ByteDance, а буквально на днях появилась информация, что в Рио-де-Жанейро построят крупнейший в Латинской Америке кампус ЦОД Rio AI City.

Постоянный URL: http://servernews.kz/1122445
07.05.2025 [09:05], Владимир Мироненко

IBM разработала инструменты для быстрого создания и интеграции ИИ-агентов

IBM планирует укрепить свои позиции на быстрорастущем рынке ИИ-технологий с помощью увеличения инвестиций в США и предложения собственных инструментов, которые помогут клиентам управлять ИИ-агентами для их ключевых бизнес-приложений. Об этом сообщил генеральный директор IBM Арвинд Кришна (Arvind Krishna) в интервью агентству Reuters.

Глава IBM заявил, что разработанное компанией ПО позволяет клиентам создавать собственные ИИ-системы, а также интегрировать ИИ-агентов от других провайдеров, включая Salesforce, Adobe и Workday. Это поможет удовлетворить потребность в кастомных решениях во многих областях бизнеса.

Подход IBM заключается в том, чтобы предложить полный спектр облачных и ИИ-сервисов остальным компаниям, которые в настоящее время полагаются на лидеров рынка AWS и Microsoft. Особое внимание IBM уделяет внедрению функций ИИ в мультиоблачных платформах, что найдёт спрос среди тех, кому нужны кастомные ИИ-решения, а также в собственные инфраструктуры заказчиков для управления данными.

 Источник изображения: IBM

Источник изображения: IBM

По словам гендиректора IBM, предлагаемые инструменты, позволяющие создавать собственных ИИ-агентов в течение не более пяти минут, основаны на семействе LLM Granite, а также на альтернативных моделях от Meta Platforms и Mistral. IBM сообщила, что уже получила заказы на создание решений на базе генеративного ИИ на $6 млрд.

Также компания объявила в апреле о планах инвестировать в течение пяти лет $150 млрд в США, где она в течение более 60 лет производит мейнфреймы. Кришна подчеркнул, что квантовые компьютеры тоже будут производиться в США. Глава IBM отметил, что синергия мейнфреймов, ИИ и квантовых вычислений, как ожидается, создаст надёжный и устойчивый рынок, в который следует инвестировать и который позволит компании использовать эти достижения в течение следующего десятилетия.

Кришна добавил, что фокус на технологии и сокращение регулирования со стороны администрации оказали благотворное влияние на экономику США, способствуя её росту. Это позволяет IBM наращивать инвестиции и инновации, тем самым потенциально укрепляя свою конкурентную позицию как поставщика бизнес-решений на основе ИИ.

Постоянный URL: http://servernews.kz/1122412
06.05.2025 [21:12], Руслан Авдеев

Meta✴ Llama API задействует ИИ-ускорители Cerebras и Groq

Meta объединила усилия с Cerebras и Groq для инференс-сервиса с применением API Llama. Открыв API-доступ к собственным моделям, Meta становится чуть более похожа на облачных провайдеров.

Как утверждают в Cerebras, разработчики, применяющие API для работы с моделями Llama 4 Cerebras, могут получить скорость инференса до 18 раз выше, чем у традиционных решений на базе GPU. В компании объявили, что такое ускорение позволит использовать новейшее поколение приложений, которые невозможно построить на других ИИ-технологиях. Речь, например, идёт о «голосовых» решениях с низкой задержкой, интерактивной генерации кода, мгновенном многоэтапном рассуждении и т. п. — многие задачи можно решать за секунды, а не минуты.

После запуска инференс-платформы в 2024 году Cerebras обеспечила для Llama самый быстрый инференс, обрабатывая миллиарды токенов через собственную ИИ-инфраструктуру. Теперь прямой доступ к альтернативам решений OpenAI получит широкое сообщество разработчиков. По словам компании, партнёрство Cerebras и Meta позволит создавать ИИ-системы, «принципиально недосягаемые для ведущих облаков». Согласно замерам Artificial Analysis, Cerebras действительно предлагает самые быстрые решения для ИИ-инференса, более 2600 токенов/с для Llama 4 Scout.

 Источник изображения: ***

Источник изображения: Meta

При этом Cerebras не единственный партнёр Meta. Она также договорилась с Groq об использовании ускорителей Language Processing Units (LPU), которые обеспечивают высокую скорость (до 625 токенов/с), низкую задержку и хорошую масштабируемость при довольно низких издержках. Groq использует собственную вертикально интегрированную архитектуру, полностью контролируя и железо, и софт. Это позволяет добиться эффективности, недоступной в облаках на базе универсальных ИИ-чипов.

Партнёрство с Meta усиливает позиции Groq и Cerebras в борьбе с NVIDIA. Для Meta новое сотрудничество — очередной шаг в деле выпуска готовых open source ИИ-моделей, которые позволят сосредоточиться на исследованиях и разработке, фактически передав инференс надёжному партнёру. Разработчики могут легко перейти на новый стек без необходимости дообучения моделей или перенастройки ускорителей — API Llama совместимы с API OpenAI. Пока что доступ к новым API ограничен. Цены Meta также не сообщает.

Meta активно работает над продвижением своих ИИ-моделей. Так, она даже выступила с довольно необычной инициативой, предложив «коллегам-конкурентам» в лице Microsoft и Amazon, а также другим компаниям, поделиться ресурсами для развития и обучения моделей Llama.

Постоянный URL: http://servernews.kz/1122365

Входит в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности»;

Система Orphus