Материалы по тегу: облако
27.06.2024 [14:39], Руслан Авдеев
США расследуют деятельность «большой тройки» китайских телеком-компанийАмериканские власти расследуют деятельность китайских телеком-операторов China Mobile, China Telecom и China Unicom. Datacenter Dynamics сообщает, что меры будут приниматься на фоне опасений, что принадлежащие государству компании могут обеспечивать китайское правительство сведениями об американских данных с помощью своих облаков и каналов связи. По данным СМИ, власти уже завершили анализ рисков в отношении China Mobile и China Telecom, но пока не слишком преуспели в расследовании работы China Unicom. Все три компании в той или иной степени ведут дела в США, хотя в очень ограниченных масштабах — после решения ограничить их деятельность из-за возможных угроз национальной безопасности. В 2022 году Федеральная комиссия связи (FCC) США отозвала разрешение подразделения China Unicom Americas предоставлять телекоммуникационные сервисы в США. Аналогичный запрет в отношении China Telecom ввели в 2021 году. Наконец, поданную China Mobile заявку на предоставление на территории США услуг телефонной связи отклонили ещё в 2019 году. Ранее в 2024 году FCC предписала американским подразделениям China Telecom, China Unicom и China Mobile прекратить в стране операции связанные с фиксированным и мобильным доступом в интернет. Ранее регулятор объявил, что китайские телеком-компании эксплуатируются китайским правительством, находятся под его влиянием и контролируются им. Особо отмечены риски, связанные с доступом к точкам присутствия (POP) в США, обычно расположенным в ЦОД. СМИ сообщают, что свидетельств предоставления значимых данных китайским властям найдено не было, как и следов нанесения какого-либо ущерба США. Несмотря на запреты, компании по-прежнему могли предоставлять в стране облачные сервисы. По данным источников СМИ, регуляторам ещё предстоит устранить эту потенциальную угрозу. В частности, возможен запрет на работу в ЦОД и маршрутизацию трафика. В результате даже оставшийся в стране бизнес китайской «большой тройки» будет парализован. Буквально на днях сообщалось, что китайские компании ищут всё новые пути обхода американских санкций, например, используя запрещённые к экспорту чипы для вычислений на территории самих США. При этом США постоянно усиливают санкции, начиная с 2019 года. Был введён запрет на закупку телеком-оборудования ряда вендоров, использование Google Mobile Services, продажу технологий и чипов и т.д.
26.06.2024 [08:32], Владимир Мироненко
Данные стали «валютой» для ИИ, но для их обработки нужно немало реальной валютыВ эпоху ИИ данные рассматриваются как «валюта». Поэтому спрос на инструменты для интеграции, хранения и обработки данных становится растущим приоритетом среди предприятий, пишет IEEE ComSoc. Ожидается, что к 2025 году объём генерируемых в мире данных достигнет 180 Збайт по сравнению со 120 Збайт в 2023 году. И всё это потребует немало оборудования. Согласно оценкам BofA Global Research, средний размер наборов данных, необходимых для обучения моделей ИИ, увеличился с 5,9 млн записей в 2010 году до 750 млрд в 2023 году. В опросе BofA 150 IT-профессионалов в качестве ключевых вариантов использования ИИ были указаны потоковая обработка данных (44 %) и машинное обучение (37 %). Кроме того, ИИ подталкивает к переносу данных в облака. По оценкам Gartner, к 2027 году 74 % платформ управления данными будет развёрнуто в облаках по сравнению с 60 % в 2023 году. Затраты на инфраструктурное ПО для работы с данными представляют собой главную статью расходов ИТ-отделов. По оценкам участников опроса, на такое ПО приходится 35 % от общих расходов на ИТ. При этом ожидается, что бюджеты вырастут на 9 % в течение следующих 12 месяцев. Публичные облака вошли в тройку лидеров среди поставщиков таких решений. Они же получают и немало выручки. Согласно подсчётам BofA, оборот индустрии инфраструктурного ПО (хранилища и озёра, работа с неструктурированными данными и т. д.) в настоящее время составляет около $96 млрд, и он может вырасти до $153 млрд в 2028 году. Что касается «железа», то BofA прогнозирует стремительное увеличение капитальных затрат у Amazon, Alphabet/Google и Meta/Facebook — в 2024 году они вырастут на 43 % в годовом исчислении до $145 млрд. Большая часть увеличения придётся на серверы и оборудование:
Также исследователи отметили, что Meta✴ лидирует по соотношению капвложений и выручки (% от выручки), и с 2022 года компания постоянно наращивает капитальные затраты на ИИ (собственный суперкомпьютер, LLM и т. д.). Расходы Meta✴ по объёму сравнимы с расходами более крупных гиперскейлеров. Одним из возможных результатов может быть появления нового облачного решения для рекламодателей.
25.06.2024 [13:20], Руслан Авдеев
Xerox перенесёт нагрузки из старых ЦОД в облако Microsoft AzureКомпания Xerox организовала миграцию из собственных ЦОД в облако Microsoft Azure. По данным Datacenter Dynamics, переход осуществляется с помощью компании Tata Consultancy Services (TCS), которая будет способствовать переносу нагрузок со старых дата-центров в публичное облако. По состоянию на 2016 год Xerox имела восемь дата-центров: два в Канаде, четыре в Европе и два в США. О текущем состоянии инфраструктуры ЦОД Xerox сегодня известно очень мало, как и о том, намерена ли она окончательно отказаться от собственных ЦОД. При этом говорится, что после миграции Xerox получит облачную ERP-платформу и начнёт использовать технологии вроде генеративного ИИ в своей деятельности. TCS разработает новую операционную модель для компании с акцентом на работу в облачной инфраструктуре, в числе прочего речь идёт о создании корпоративной ИИ-платформы. По словам Xerox, инициатива, связанная с цифровой трансформацией — важный этап для пересмотра модели работы компании, призванный упростить как ключевые процессы, так и улучшить клиентский опыт. Впервые Xerox объявила о намерении отдать приоритет облакам ещё в 2023 году. Как сообщают в TCS, инициатива позволит организации со столетней историей быстро трансформироваться в более гибкую и высокотехнологичную компанию. Катализатором этого, по словам компании, стали технологии генеративного ИИ.
24.06.2024 [16:41], Владимир Мироненко
Fujitsu представила новые инструменты для работы с моделями генеративного ИИ корпоративного классаFujitsu представила свою стратегию в области ИИ, в рамках которой она планирует уделять основное внимание не разработке генеративного ИИ (GenAI), а совершенствованию платформы, которая упростит предприятиям настройку своих собственных ИИ-решений, пишет DigiTimes. По словам японской компании, анонсированная в начале июня платформа Fujitsu GenAI Framework for enterprises предназначена для решения проблем, с которыми сталкиваются предприятия при применении генеративного ИИ, таких как сложность получения и обработки больших объёмов обучающих данных, неспособность удовлетворить разнообразные требования к стоимости и скорости обработки, а также потенциальный риск невыполнения требований законодательства или внутренних правил компаний. Эта платформа будет доступна клиентам по всему миру начиная с июля 2024 года в облаке Fujitsu Kozuchi. Как сообщается, Fujitsu включила в GenAI Framework for enterprises несколько ключевых технологий: Knowledge Graph Extended Retrieval-Augmented Generation (RAG), GenAI Amalgamation и GenAI Auditing. RAG — это широко используемый метод донастройки моделей GenAI для корпоративных приложений. Его недостатком является фрагментированное и несвязное обучение знаниям на больших объёмах данных. Например, модель может ссылаться на разные и несовместимые руководства по ремонту автомобилей или неправильно цитировать законодательные положения, путая смысл запрещённых и нерекомендуемых действий. Устранить этот недостаток поручено Fujitsu Knowledge Graph Extended RAG путём формирования графа знаний для контекстуализации обучающих данных. Как утверждает Fujitsu, Fujitsu Knowledge Graph Extended RAG позволяет сократить объём необходимых для обучения данных на четверть. Помимо повышения эффективность обучения, технология также обеспечивает мониторинг в реальном времени результатов работы. Она предлагает поддержку логических рассуждений, позволяя легко определить, применимы ли результаты. Модель может обрабатывать более 10 млн токенов, что позволяет ей учиться на больших объёмах сложных данных и генерировать высокоточные ответы. GenAI Amalgamation позволяет выбрать модель с наивысшей производительностью из нескольких специализированных моделей на основе входной задачи или автоматически объединяет несколько имеющихся моделей для выполнения запроса. Это позволяет пользователям легко адаптировать подходящие ИИ-модели GenAI, сокращая время, необходимое для настройки модели, и повышая эффективность работы. Наконец, технология аудита ИИ (GenAI Auditing) — первая в мире, по словам Fujitsu — позволяет объяснить, почему модель дала тот или иной ответ, что упростит её проверку на соответствие законодательству и правилам компании, а заодно позволит избавиться от галлюцинаций.
23.06.2024 [22:50], Владимир Мироненко
Облачный союз: Apple использует ИИ-инфраструктуру Google Cloud для Apple IntelligenceИИ-инфраструктура Apple Private Cloud Compute использует не только базовую ИИ-модель собственной разработки и серверы Apple для инференса, работающие на собственных чипах Apple, но и облако Google Cloud Compute, обратил внимание ресурс HPCWire. Сведения об ML-платформе Apple AXLearn указывают на гибридный подход к работе с ИИ, при котором Apple объединяет свои собственные серверы с возможностями Google Cloud, сообщил HPCwire, отметив, что новая инфраструктура является для Apple большим шагом вперёд. Например, Google и Microsoft, активно работают над развёртыванием ИИ ещё с конца 2022 года. Выпуск собственных систем знаменует возвращение Apple в сектор серверного оборудования после того, как в 2011 году она прекратила выпуск Xserve. Apple сообщила в своём блоге, что AXLearn использует фреймворк Google JAX и компилятор XLA и позволяет обучать модели с высокой эффективностью и масштабируемостью на различном оборудовании и облачных платформах, включая фирменные ИИ-ускорители Google TPU, а также облачные и локальные ускорители на базе GPU (конкретные модели не уточняются). У Apple есть две новые собственные ИИ-модели, одна из которых имеет 3 млрд параметров и используется для ИИ приложений на устройствах, а также более крупная LLM для запуска на серверах. Модели, разработанные с помощью фреймворка TensorFlow, созданного Google, были обучены на TPU Google. При этом AXLearn включает оркестратор, который пока работает только с Google Cloud. Впрочем, Apple оговаривается, что «теоретически его можно расширить для работы на платформах других облачных провайдеров». Инференс же выполняется исключительно на собственных серверах компании, причём для обработки запроса пользователя каждый раз создаётся новый временный инстанс, который безвозвратно удаляется вместе с данными после завершения задачи, а для передачи информации используется сквозное шифрование. Apple в рамках объявленного на WWDC 2024 сотрудничества c OpenAI интегрирует чат-бот ChatGPT в голосового помощника Siri, а также в другие инструменты iOS и остальных платформ. Поскольку существуют риски утечки данных на сторонней платформе, устройства Apple будут направлять запрос на разрешение пользователя отправлять данные в ChatGPT.
22.06.2024 [00:21], Владимир Мироненко
Oracle построит в Испании третий облачный регион и инвестирует $1 млрд в течение 10 летOracle объявила о планах инвестировать более $1 млрд в течение десяти лет в облачную и ИИ-инфраструктуру в Испании. Эти инвестиции позволят Oracle запустить в стране третий облачный регион, который будет размещён в Мадриде, пишет ресурс Data Center Dynamics. Впрочем, на фоне инвестиций других гиперскейлеров вложения Oracle довольно скромны. Новый регион позволит перенести нагрузки в облако Oracle Cloud Infrastructure (OCI) с соблюдением требований местного законодательства, включая Закон о цифровой операционной устойчивости ЕС (Digital Operational Resilience Act, DORA), и требований европейских надзорных органов, таких как Европейская служба банковского надзора (European Banking Authority, EBA), Европейское управление страхования и пенсионного обеспечения (European Insurance and Occupational Pensions Authority, EIOPA). Хостинг-партнёром запланированного облачного региона будет Telefónica España. Директор по эксплуатации, сети и ИТ Telefónica España заявил, что компания продолжает миграцию части своей критически важной инфраструктуры в облако Oracle, «чтобы быть более гибкими в предоставлении инновационных продуктов и услуг клиентам по всему миру». Первый облачный регион Oracle в Испании был открыт в 2022 году. Будущий облачный регион Oracle в Мадриде поможет организациям государственного и частного сектора страны перенести все типы рабочих нагрузок в облако, модернизировать свои приложения и внедрять инновации с использованием данных, аналитики и ИИ, говорит компания. Как отметил ресурс CIO News Southeast Asia, Oracle — единственный гиперскейлер, способный предоставлять технологии ИИ и полный набор из более чем 100 облачных сервисов в выделенных, публичных и гибридных облачных средах в любой точке мира. Ранее в этом месяце Microsoft открыла в Испании свой первый облачный регион Spain Central, который тоже размещён в Мадриде, и партнёром компании тоже стала Telefónica España. Регион был запущен в рамках проекта компании по цифровой трансформации государственного и коммерческого сегментов Испании стоимостью $2,1 млрд. После этого Microsoft объявила о намерении инвестировать €6,69 млрд ($7,16 млрд) в строительство новых ЦОД в Арагоне. Amazon намерена вложить в расширение своего облачного подразделения в Испании €15,7 млрд ($16,9 млрд). У Google также имеет облачный регион в этой стране, размещённый в Мадриде, который был открыт в мае 2022 года. В ноябре этого же года компания договорилась с немецким разработчиком энергетической инфраструктуры ib vogt о поставках энергии из возобновляемых источников для питания дата-центров и офисов на территории Испании.
21.06.2024 [09:31], Владимир Мироненко
HPE представила собственное решение для виртуализации и уверяет, что вовсе не собирается конкурировать с VMwareHPE представила собственное решение для виртуализации, которое, по словам главного операционного директора HPE по гибридному облаку Ханга Тана (Hang Tan), не несёт прямой угрозы решениям VMware. Он пояснил ресурсу The Register, что это было сделано вовсе не из-за конъюнктурных соображений, а в ответ на запросы клиентов. Решение HPE использует KVM на базе Ubuntu вместе с ПО для оркестрации в рамках платформы HPE Private Cloud. Как и другое ПО HPE Private Cloud, новое решение может работать в гибридной среде или автономно. После поглощения VMware в конце прошлого года Broadcom внесла изменения в порядок лицензирования, после чего многие клиенты стали жаловаться на рост затрат на использование её продуктов. И хотя Broadcom настаивает на том, что изменения также включали снижение цен на некоторые продукты и в целом несут выгоду клиентам, конкуренты VMware спешат воспользоваться создавшейся ситуацией и переманить недовольных новой политикой чипмейкера. Тан сообщил The Register, что появление виртуализации в HPE Private Cloud было естественным развитием гибридной стратегии, которую гендиректор Антонио Нери (Antonio Neri) продвигает на протяжении многих лет. Он отметил, что в рамках реализации стратегии HPE занялась контейнеризацией, управлением облачными данными и AIOps, в основном закрывая направления путём поглощения специализированных компаний. В конце концов HPE задалась вопросом, чего ещё не хватает для комплексного обслуживания клиентов. И ответом стала виртуализация. Так что объявление HPE о собственном продукте виртуализации в сложное для Broadcom время является исключительно совпадением. HPE по-прежнему предлагает продукты VMware, которые, по словам Тана, она рассматривает как дополнение к собственным предложениям HPE по виртуализации. Какими будут расценки на новое предложение HPE, пока не сообщается. По всей видимости, они станут известны во II половине 2024 года, когда новый продукт станет доступен в составе HPE Private Cloud Business Edition. Затем решение будет добавлено и в другие версии HPE Private Cloud.
20.06.2024 [17:32], Руслан Авдеев
Дата-центры, склады, роботы и ИИ: Amazon потратит ещё €10 млрд на развитие бизнеса в ГерманииAmazon потратит €10 млрд ($10,7 млрд) на обновление дата-центров и модернизацию логистической сети в Германии, передаёт Silicon Angle. Всего несколько недель назад облако Amazon Web Services (AWS) объявила о намерении потратить €7,8 млрд ($8,36 млрд) в той же Германии на суверенную облачную платформу AWS European Sovereign Cloud. Часть из €10 млрд Amazon потратит на найм ещё 4 тыс. сотрудников в центры обработки заказов в нескольких немецких городах, в результате чего общий штат сотрудников в Германии вырастет до более 40 тыс. человек. Amazon также управляет в Германии сетью из четырёх инжиниринговых центров — компания объявила о намерении расширить свой берлинский кампус. Целью является поддержка работ, связанных с робототехникой и ИИ. Другая часть инвестиций будет использована для «постройки, поддержки и обслуживания» кластера облачных дата-центров в районе Франкфурта. Сейчас франкфуртский облачный регион AWS включает три зоны доступности, изолированные друг от друга на физическом уровне, и две т.н. «локальные зоны», расположенные ближе к потребителям. Для AWS European Sovereign Cloud будет построен дата-центр в земле Бранденбург, он заработает к концу следующего года. Предполагается, что эти облачные мощности будут обслуживаться только персоналом из Евросоюза. Ранее компания уже сообщала о том, что метаданные пользователей из ЕС будут храниться на территории блока. Год назад схожий проект реализовала в регионе компания Oracle.
20.06.2024 [14:54], Владимир Мироненко
HPE и NVIDIA представили совместные решения для ускорения внедрения ИИHewlett Packard Enterprise (HPE) и NVIDIA представили платформу NVIDIA AI Computing by HPE — портфель совместно разработанных решений для ускорения внедрения генеративного ИИ. Ключевым в портфеле является предложение HPE Private Cloud AI. Как указано в пресс-релизе, это первое в своём роде комплексное решение, которое обеспечивает самую глубокую на сегодняшний день интеграцию вычислительных технологий, сетей и ПО NVIDIA с хранилищем, вычислительными ресурсами и облачной платформой HPE GreenLake. Решение предоставляет предприятиям любого размера возможность быстрой и эффективной разработки и развёртывания приложений генеративного ИИ. Решение HPE Private Cloud AI с новой функцией OpsRamp AI Copilot, которая позволяет повысить эффективность ИТ-операций и обработки рабочих нагрузок, включает в себя облачную среду самообслуживания с полным управлением жизненным циклом. Оно доступно в четырёх конфигурациях (Small, Medium, Large и Extra Large) для поддержки рабочих нагрузок ИИ различной сложности. HPE Private Cloud AI также поддерживает инференс, точную настройку моделей и их дообучение посредством RAG с использованием собственных данных. Решение сочетает в себе средства контроля конфиденциальности, безопасности, прозрачности и управления данными, в том числе средства ITOps и AIOps. AIOps использует машинное обучение и анализ данных для автоматизации и улучшения ИТ-операций. ITOps включает в себя ряд инструментов, обеспечивающих бесперебойное функционирование ИТ-инфраструктуры организации. Конфигурация HPE Private Cloud AI Small, предназначенная для инференса, включает от четырёх до восьми ускорителей NVIDIA L40S, до 248 Тбайт дискового пространства и 100GbE-подключение в стойке мощностью 8 кВт. Конфигурация Medium, предназначенная для инференса и RAG, включает до 16 ускорителей NVIDIA L40S, до 390 Тбайт дискового пространства и 200GbE-подключение в стойке мощностью 17,7 кВт. Конфигурации Large и Extra Large предлагают дополнительные возможности по обработке нагрузок ИИ и ML, а также тонкой настройке ИИ-модели. Конфигурация Large включает до 32 ускорителей NVIDIA H100 NVL, до 1,1 Пбайта дискового пространства и 400GbE-интерконнект в двух стойках мощностью 25 кВт каждая. В свою очередь, конфигурация Extra Large включает до 24 ускорителей NVIDIA GH200 NVL2, до 1,1 Пбайта дискового пространства и 800GbE-интeрконнект в двух стойках мощностью 25 кВт каждая. Стойки могут управляться клиентом самостоятельно или обслуживаться HPE. Каждая конфигурация может работать как автономное локальное решение ИИ или в составе гибридного облака. Используется программная платформа NVIDIA AI Enterprise, включающая микросервисы инференса NIM. Её дополняет ПО HPE AI Essentials. Кроме того, поддержку новых ускорителей NVIDIA получили три аппаратные платформы:
HPE также объявила, что её облачная платформа HPE GreenLake for File Storage прошла сертификацию Nvidia DGX BasePOD и валидацию хранилища NVIDIA OVX, HPE Private Cloud AI, а также анонсированное оборудование будут доступны этой осенью за исключением платформы Cray XD670 на базе NVIDIA H200 NVL, который поступит в продажу этим летом. А после станут доступны и решения на базе Blackwell.
19.06.2024 [11:16], Руслан Авдеев
ВМС США успешно подключили к облаку авианосец «Авраам Линкольн»Военно-морские силы США успешно реализовали пилотный проект, предусматривающий подключение военных кораблей к облачным сервисам. По данным Datacenter Dynamics, работоспособность концепции, предусматривающей передачу в облако терабайт данных ежедневно, изучили на примере авианосца «Авраам Линкольн». Облачный проект Flank Speed Edge с тысячами пользователей — это одно из расширений проекта Flank Speed, предусматривающего совместную работу в облаке многих представителей военного и государственного аппарата. Возможность масштабной передачи данных обеспечена спутниковыми сервисами Proliferated Low Earth Orbit (P-LEO). Находящиеся на низкой околоземной орбите спутники могут общаться в том числе и друг с другом. В ходе пилотного проекта ВМС организовали спутниковое соединение гигабитного класса — возможна передача 3–5 Тбайт данных ежедневно. Например, можно использовать IP-телефонию, передавать данные в целях обучения, для медицинских сервисов, снабжения. При этом отмечается, что в случае необходимости все эти сервисы могут быть отключены без потери функциональности корабля. Вся спутниковая инфраструктура вместе с набортной сетью Wi-Fi может управляться всего тремя моряками. Проект также позволяет обновлять бортовое ПО без необходимости захода в порт. Отмечается, что иногда высокоскоростные соединения необходимо отключать, поскольку P-LEO обеспечивает безопасную передачу только не особенно секретных данных. При этом инфраструктура разработана таким образом, что способна использовать многочисленные механизмы подключения, включая военную группировку SATCOM и Starlink. Дополнительно ВМС внедряют систему Flank Speed Edge на береговых объектах, испытывающих трудности с традиционными вариантами подключения, включая, например, штаб-квартиру Пятого флота США в Бахрейне. В ходе недавнего отчёта о доходах председатель Oracle Ларри Эллисон (Larry Ellison) поднял вопрос о возможности использования микро-ЦОД на кораблях и даже подводных лодках. По его словам, скоро компания сможет обеспечить работу полноценного облака Oracle Cloud всего на шести стойках половинной высоты, которые можно разместить где угодно — в том числе на подводных и надводных кораблях. По мнению Эллисона, такое не может предложить никакая другая компания. При этом все облака Oracle идентичны и поддерживают все сервисы Oracle, отличаясь только масштабом. |
|