Материалы по тегу: ocp
27.12.2023 [18:48], Сергей Карасёв
До 16 GPU на один сервер: представлен российский OCP-модуль Delta SprutКомпания Delta Computers объявила о выпуске первой отечественной аппаратной OCP-платформы для ИИ-ускорителей — решения под названием Delta Sprut. Это специализированный модуль расширения (JBOG), допускающий подключение дополнительных PCIe-устройств к вычислительным узлам. Модуль Delta Sprut, выполненный в форм-факторе 2OU поддерживает интерфейс PCIe 4.0. Имеются четыре разъёма PCIe 4.0 x16 с возможностью установки четырёх карт HHHL или двух изделий FHFL мощностью до 350 Вт. Говорится о совместимости с вычислительными узлами Delta Tioga Pass и Delta Bright Lake. Допускается подключение к двум хостам. Модуль Delta Sprut позволяет в режиме каскадирования подключать к одному вычислительному блоку до восьми GPU двойной или до 16 GPU стандартной высоты, что, как утверждается, устанавливает рекорд плотности в 160 GPU в одном OCP-шасси. В частности, могут быть задействованы ускорители NVIDIA А100 и NVIDIA H100, а также AMD Instinct. Для устройств NVIDIA поддерживается попарное объединение мостами NVLink. Среди ключевых областей применения Delta Sprut названы системы ИИ и машинного обучения, платформы класса ChatGPT, HPC и 3D VDI. Имеется возможность расширения подсистемы хранения на базе Delta Argut — до 120 U.2-накопителей NVMe SSD. Модульная конструкция упрощает доступ ко всем его компонентам: для обслуживания не требуются инструменты. Ожидается, что в январе 2024 года Delta Sprut войдёт в реестр Минпромторга РФ.
23.10.2023 [17:45], Сергей Карасёв
Создан альянс по стандартизации новых форматов данных для ИИ: в нём участвуют AMD, Arm, Intel и NVIDIAОрганизация Open Compute Project Foundation (OCP) объявила о формировании альянса Microscaling Formats (MX) Alliance, который займётся стандартизацией новых форматов данных для ИИ. Проект поддержали AMD, Arm, Intel, Meta✴, Microsoft, NVIDIA и Qualcomm. Традиционными форматами чисел с плавающей запятой являются FP32 (одинарная точность) и FP16 (половинная точность). Однако при решении задач ИИ целесообразно применять вычисления с более низкой точностью для повышения производительности и снижения затрат энергии. Ранее был внедрён формат FP8, а также различные вендорские решения вроде BF16 или TF32. Для инференса же всё чаще применяется INT8. Теперь участники альянса MX предлагают стандартизовать 6- и 4-бит типы данных для обучения ИИ-моделей и инференса. Предполагается, что форматы MX будут востребованы в различных сценариях, таких как большие языковые модели (LLM), компьютерное зрение и рекомендательные системы. Причём использование вычислений с такой точностью не потребует каких-либо изменений в традиционных алгоритмах обучения. Изначально спецификация MX (OCP MX v1.0) предусматривает четыре формата данных: MXFP8, MXFP6, MXFP4 и MXINT8. Они, как утверждается, совместимы с существующими платформами ИИ, а также обеспечивают гибкость реализации как на аппаратном, так и на программном уровне. Появление новых форматов данных поможет ускорить реализацию ряда ИИ-проектов благодаря снижению требований к объёму памяти и пропускной способности интерфейсов.
23.10.2023 [16:30], Сергей Карасёв
Cloudflare избавляется от BMC на серверных материнских платахАмериканская компания Cloudflare, предоставляющая услуги CDN, по сообщению ресурса The Register, приняла решение отказаться от интегрированных BMC-контроллеров на серверных материнских платах. Предполагается, что это в числе прочего снизит затраты на развёртывание масштабных платформ для дата-центров. BMC, или Baseboard Management Controller, контролирует работу платформы и выполняет ряд важных функций, таких как управление питанием, мониторинг датчиков, возможность удаленного обновления прошивки, регистрация событий, формирование отчетов об ошибках и т.д. Современные серверные материнские платы с поддержкой DDR5 и PCIe 5.0 насчитывают 14 или более слоёв. Вместе с тем для BMC достаточно от восьми до десяти слоёв. Поэтому целесообразно отделить модуль BMC от основной материнской платы, выполнив его в виде отдельного узла OCP DC-SCM (DataCenter-ready Secure Control Module). Модули DC-SCM можно использовать повторно, что снижает стоимость серверов и сокращает объём «электронного мусора» при обновлении оборудования для ЦОД. Поскольку DC-SCM является отдельным компонентом, к серверу можно добавлять новые модули с целью апгрейда функций без необходимости замены материнской платы. Cloudflare предлагает собственную версию DC-SCM под названием Project Argus в рамках Open Compute Project (OCP). В основу положен контроллер Aspeed AST2600. При использовании совместимой прошивки OpenBMC обеспечивается богатый набор функций, необходимых для удалённого управления сервером. Project Argus уже используется в 12-м поколении серверов CloudFlare, а производственным партнёром компании выступает Lenovo.
22.10.2023 [13:58], Сергей Карасёв
Hyve Solutions представила платформу хранения Hercules 9120 сверхвысокой плотностиКомпания Hyve Solutions, подразделение корпорации TD SYNNEX, на мероприятии OCP Global Summit 2023 анонсировала аппаратную платформу Hercules 9120 для формирования хранилищ данных сверхвысокой плотности. Новинка соответствует стандартам OCP Open Edge. Утверждается, что решение обеспечивает преимущества в плане надёжности, доступности и удобства обслуживания. Стойка Hercules 9120 содержит восемь шасси в форм-факторе 5U, каждое из которых рассчитано на установку 96 HDD. Таким образом, общее количество накопителей в составе системы достигает 768. Заявлена поддержка интерфейса PCIe 5.0. Кроме того, говорится о совместимости с процессорами Intel Xeon Emerald Rapids, которые дебютируют в декабре нынешнего года, а также с чипами AMD EPYC Genoa. В новой СХД реализована технология Rotational Vibration Interference (RVI), снижающая влияние вибрации дисков на работу платформы в целом. Благодаря этому, как утверждается, в перспективе можно будет применять HDD вместимостью до 50 Тбайт: выпуск таких накопителей ожидается ориентировочно в 2026 году. В этом случае суммарная ёмкость системы будет достигать 38,4 Пбайт. Платформа Hercules 9120 ориентирована на гиперскейлеров и операторов облачных платформ. Решение подходит для поддержания приложений ИИ, машинного обучения и других задач, предъявляющих высокие требования к СХД.
21.10.2023 [01:01], Алексей Степин
Собери сам: Arm открывает эру кастомных серверных процессоров инициативой Total DesignСегодня на наших глазах в мире процессоростроения происходит серьёзная смена парадигм: от унифицированных архитектур общего назначения и монолитных решений разработчики уходят в сторону модульности и активного использования специфических аппаратных ускорителей. Разумеется Arm не осталась в стороне — на мероприятии 2023 OCP Global Summit компания рассказала о новой инициативе Arm Total Design. Эта инициатива должна помочь как создателям новых процессоров за счёт ускорения процесса разработки и снижения его стоимости, так и владельцам крупных вычислительных инфраструктур. Последние всё больше склоняются к специализации и дифференциации в процессорных архитектурах новых поколений, но ожидают также энергоэффективности, дружественности к экологии и как можно более низкой совокупной стоимости владения. В основе инициативы Arm лежит анонсированная ещё в августе на HotChips 2023 процессорная платформа Arm Neoverse Compute Subsystem (CSS). Neoverse CSS N2 (Genesis) представляет собой готовый набор IP-решений Arm, включающий в себя процессорные ядра, внутреннюю систему интерконнекта, подсистемы памяти, ввода-вывода, управлениям питанием, но оставляющий место для интеграции партнёрских разработок — различных движков, ускорителей и т.п. По сути, речь идёт о почти готовых процессорах, не требующих длительной разработки процессорной части с нуля и всех связанных с этим процессом действий — верификации, тестирования на FPGA, валидации дизайна и многого другого. По словам Arm такой подход позволяет сэкономить разработчикам до 80 человеко-лет труда инженеров. Дизайн Neoverse CSS N2 довольно гибок: финальный процессор может включать в себя от 24 до 64 ядер Arm, работающих в частотном диапазоне 2,1–3,6 ГГц. Предусмотрено по 64 Кбайт кеша инструкций и данных, а вот объёмы кешей L2 и L3 настраиваются и могут достигать 1 и 64 Мбайт соответственно. Ядра реализуют набор инструкций Arm v9 и содержат по два 128-битных векторных блока SVE2. Имеется поддержка инструкций, характерных для ИИ-задач и криптографиии. Подсистема памяти может иметь до 8 каналов DDR5, а возможности ввода-вывода включают в себя 4 блока по 16 линий PCIe или CXL. Также возможно объединение двух чипов CSS N2 в едином корпусе, что даёт до 128 ядер на чип. В качестве внутреннего интерконнекта используется меш-сеть Neoverse CMN-700. В дизайне Neoverse CSS N2 имеются и вспомогательные ядра Cortex-M7. Они работают в составе блоков System Control Processor (SCP) и Management Control Processor (MCP), то есть управляют работой основного вычислительного массива, в том числе отвечая за его питание и тактовые частоты. Инициатива Arm Total Design расширяет рамки Neoverse Compute Subsystem: речь идёт о создании полноценной экосистемы, обеспечивающей эффективную коммуникацию между партнёрами программы Neoverse CSS и предоставление им полноценного IP-инструментария и EDA, созданных при участии Cadence, Rambus, Synopsys и др. Также подразумевается поддержка ведущих производителей «кремния» и разработчиков прошивок, в частности, AMI. В число участников проекта уже вошли такие компании, как ADTechnology, Alphawave Semi, Broadcom, Capgemini, Faraday, Socionext и Sondrel. Ожидается поддержка от Intel Foundry Services и TSMC, позволяющая говорить об эффективной реализации необходимых для мультичиповых решений технологий AMBA CHI C2C и UCIe. Будучи объединённым под одной крышей инициативы Arm Total Design, такой конгломерат ведущих разработчиков и производителей микроэлектроники и системного ПО для него, сможет в кратчайшие сроки не просто создавать новые процессоры, но и гибко отвечать на вызовы рынка ЦОД и HPC, наделяя чипы поддержкой востребованных технологий и ускорителей. В качестве примера можно привести совместный проект Arm, Socionext и TSMC, в рамках которого ведётся разработка универсального чиплетного процессора, который в различных вариантах компоновки будет востребован гиперскейлерами, поставщиками инфраструктуры 5G/6G и разработчиками периферийных ИИ-систем.
19.10.2023 [20:31], Руслан Авдеев
ExxonMobil представила серию жидкостей для погружных СЖОХотя нефтегазовый гигант ExxonMobil и не пользуется прежним авторитетом в эпоху продвижения экобезопасных технологий, его продукция по-прежнему востребована. Как сообщает Datacenter Dynamics, в числе прочего речь идёт и об охлаждающих жидкостях на основе ископаемых углеводородов — они используются в СЖО, а экономия на совокупной стоимости владения (TCO) ЦОД с их применением составляет до 40 % в сравнении с классическим воздушным охлаждением, заявляет компания. Кроме того, улучшается показатель PUE. Так, в рамках мероприятия Open Compute Project (OCP) Global Summit компания анонсировала серию «синтетических и несинтетических жидкостей» EM DC 3152/3150/315, 3220, 3235 Super, 3250, 1150 и 1210 (AP). Поскольку дата-центры давно испытывают проблемы в связи с ростом спроса и вычислительной плотности, вопрос использования СЖО, в том числе иммерсионных, становится всё более актуальным. При этом будущее весьма эффективных PFAS-химикатов пока что находится под вопросом. Впрочем, сегодня доступны даже охлаждающие жидкости растительного происхождения, а ExxonMobil предлагает собственные варианты на основе углеводородов. Похожие решения есть у Castrol и Shell. ExxonMobil намеревается расширять добычу ископаемых ресурсов и дальше, несмотря на заявления ООН и прочих структур о вреде такой деятельности для окружающей среды. Вместе с тем компания вкладывает миллионы долларов в исследования, свидетельствующие об отсутствии влияния использования ископаемого топлива на глобальное потепление. Кроме того, ExxonMobil обещает к 2050 году свести к нулю выбросы в атмосферу, связанные с её действиями, параллельно отказываясь нести какую-либо ответственность за последствия использования добытых ей нефти и газа.
19.10.2023 [01:40], Алексей Степин
Axiado представила новый класс сопроцессоров — TCUНа мероприятии 2023 OCP Global Summit компания Axiado представила новый класс аппаратных сопроцессоров — TCU (Trusted Control/Compute Unit), предназначенный для управления и защиты IT-инфраструктуры от различного рода атак. Защитных механик в мире ИТ существует множество, но и киберпреступники постоянно совершенствуют методы атак, задействуя порой самые экзотические атак по сторонним каналам, к примеру, используя механизмы динамического управления напряжением и частотой в современных процессорах. Не всегда спасает положение даже подход «нулевого доверия» (Zero Trust), поскольку программная реализация также уязвима ко взлому или утере ключей. Решение Axiado — аппаратный контроль в реальном времени, использующий ИИ, который позволяет предсказывать и предотвращать разного рода атаки, дообучаясь в процессе. Последнее, по мнению компании, быть на шаг впереди злоумышленников и предотвращать возможный взлом ещё на этапе первых подозрительных действий, производимых в системе. Чипы серии AX2000/3000 способны выполнять и другие функции: Platform Root of Trust, BMC или TPM. При этом предполагается использование модульной и открытой программной архитектуры на основе PFR (Platform Firmware Resilence) и OpenBMC. Чипы Axiado AX2000/3000 содержат четыре инференс-движка общей мощностью 4 Топс, четыре ядра общего назначения Arm Cortex A53, а также модули доверенного и привилегированного исполнения, блок брандмауэра и криптодвижок. Большая часть модулей решения Axiado работает под управлением открытой ОС реального времени Zephyr. Клиент легко может доработать платформу собственными модулями. Axiado активно сотрудничает с OCP и уже разработала несколько вариантов адаптеров на базе TCU для продвигаемых консорциумом серверных форм-факторов. В портфолио компании представлены адаптеры DC-SCM 2.0 (Secure Control Module) как в вертикальном, так и в горизонтальном форм-факторах, а также в виде классического PCIe-адаптера NCM (Network Compute Module). Компания уже успела договориться о сотрудничестве с GIGABYTE, VVDN, Wiwynn, Senao и Tyan. Но этим список партнёров Axiado не ограничивается: в её решениях заинтересованы также крупные облачные провайдеры, включая AWS, Microsoft, Google и Meta✴, а также ряд других компаний и системных интеграторов.
17.10.2023 [19:00], Алексей Степин
OCP и JEDEC намерены построить «чиплетную экономику»Сейчас уже очевидно, что ставка на огромные монолитные кристаллы в деле производства сложных чипов себя исчерпала и будущее за чиплетными технологиями. Но каким будет это будущее? Комитет стандартизации полупроводниковой продукции (JEDEC) и организация Open Compute Project на проходящем в настоящее время мероприятии 2023 OCP Global Summit объявили о сотрудничестве с целью выработки единого набора стандартов и унификации чиплетной экосистемы. Такой альянс способен задействовать сильнейшие стороны участников: влиятельность JEDEC в деле установления мировых стандартов в области микроэлектроники и опыт OCP в разработке устройств системного уровня, способствующий появлению новых технологий и рынков. Это позволит избежать фрагментации и излишних затрат, вызванных дублированием усилий при разработке новых устройств. OCP уже располагает спецификациями CDXML (Chiplet Data Extensible Markup Language), включающими стандартизированное описание, которое можно использовать при работе с современными средствами автоматизированного проектирования электроники (EDA). CDXML включает в себя следующие данные:
Это облегчит обмен данными между разработчиками чиплетов и их клиентами, благо уже сейчас идёт процесс интеграции CDXML в правила JEDEC JEP30 (Part Model Guidelines), описывающие процесс такого обмена. Внутренние процессы OCP и JEDEC сотрудничество не изменит, но OCP планирует регулярные поставки новых данных, относящихся к CDXML в JEDEC (JC-11) — обычно это будет связано с выпуском обновлённых версий CDXML. В соответствии с правилами лицензирования, принятыми OCP, новые данные будут доступны всем участникам консорциума. Для ускорения интеграции новых спецификаций в стандарт JEP30 будет сформирована специальная рабочая группа, в задачи которой войдёт в том числе и достижение обоюдной договорённости о внесении необходимых изменений. Официальный стандарт будет публиковаться решением комитета JEDEC в соответствии со стандартной процедурой голосования. Создание единых спецификаций CDXML открывает дорогу целому новому направлению в разработке чипов — так называемой «чиплетной экономике» (Open Chiplet Economy), в которой разработчики чиплетов смогут посредством открытого рынка взаимодействовать с производителями чипов. Такой рынок станет возможным именно благодаря созданию унифицированной экосистемы, за поддержание которой в актуальном состоянии и будет отвечать OCP. В рамках такой экономики любой проект сможет пройти от стадии описания чиплета к его тестированию с помощью специальной платформы, оценке производительности систем интерконнекта, интеграции разнородных систем, и, наконец, сборке готового решения с оценкой его термальных характеристик. Предполагается также возможность использования фотоники и наличие интегрированных средств диагностики. В рамках проекта OCP Open Domain Specific Architecture (ODSA) уже достигнуты серьёзные успехи, в число которых входит разработка высокоскоростного конфигурируемого интерконнекта Blue Cheetah класса BoW (Bunch of Wires), создание платформы DreamBig для «умных» сетевых адаптеров, использование BoW-интерконнекта в процессоре с архитектурой RISC-V и даже интеграция BoW-технологии в 5-нм техпроцесс Samsung. А сотрудничество OCP с JEDEC должно ускорить формирование «чиплетной экономики» и избежать ошибок, свойственных закрытым стандартам и платформам.
16.10.2023 [22:21], Руслан Авдеев
Jtec Industries разработала тележку Server Rack Cart для перемещения полностью укомплектованных OCP-стоекПеремещение серверных стоек вместе с уже смонтированными серверами было бы слишком непростой задачей для грузчиков-людей, но решение есть — как сообщает The Register, на мероприятии Open Compute Summit представлена специальная тележка компании Jtec Industries, предназначенная для перемещения на значительные дистанции полностью укомплектованных стоек. Полностью загруженная стойка стандарта ORV2 или ORV3 весит порядка 1500 кг, поэтому для обычного грузчика безопасно переместить её с места на место непросто. Сама Jtec специализируется на моторизированных тележках, способных аккуратно перемещать объекты на складах, в том числе автономно. Как считают в Jtec, среди гиперскейлеров уже имеется спрос на оборудование для перемещения новых и утилизируемых стоек в больших количествах. И Server Rack Cart вполне способна выполнять подобные миссии — перевозка осуществляется с помощью управляемого оператором или автономного транспортного средства. Поскольку Jtec является одним из партнёров в OCP, гиперскейлерам будет проще доверить своё дорогостоящее во всех отношениях оборудование складским роботам. В процессе транспортировки тележка с помощью специального механизма приподнимает стойку и может свободно перемещать её туда, куда необходимо. В процессе разработки Jtec сотрудничала с одним из разработчиков автономных транспортёров, а также с неназванным гиперскейлером, судя по всему, с Meta✴. Во всяком случае, именно в павильоне последней на OCP Summit можно увидеть оборудование Jtec. Как сообщают в Jtec, прототипы успешно внедрили и теперь они работают в нескольких ЦОД гиперскейлера, но пока продукт ожидает финального тестирования безопасности эксплуатации. Первое внедрение готовых продуктов должно состояться в IV квартале 2023 года.
04.10.2023 [16:29], Руслан Авдеев
Open Compute Project (OCP) запустил программу Startup Membership для привлечения стартаповСообщество Open Compute Project (OCP), включающее крупнейших игроков рынка ЦОД, объявило о появлении особого «тарифа» для стартапов. OCP будет приглашать к сотрудничеству молодые компании, имеющие в портфолио сильные технологические решения, для того чтобы те могли внести вклад в программы совместного использования аппаратных и программных наработок для ЦОД гиепрскейлеров. Это позволит заявить о себе в индустрии. OCP делает общедоступными инновационные решения, разработанные для дата-центров. В организации уже созрело мнение о необходимости привлечь молодые перспективные компании для сохранения роли OCP Community в качестве доминирующей силы, меняющей рынок ЦОД. Организация уже давно экспериментирует с различными схемами членства для того, чтобы поощрять реальный вклад в общее дело развития рынка ЦОД. Например, сейчас предлагается система, при которой более «высокоранговые» участники платят меньше, но их вклад должен быть выше, чем обеспечивают обычные члены OCP. Предлагаются варианты членства Gold, Silver и Platinum, стоящие $60 тыс., $50 тыс. или $40 тыс. в год соответственно. Но для получения рангов такого уровня нужно делиться с сообществом спецификациями, дизайном, документацией и другими наработками. Кроме того, есть даже вариант за $5 тыс. для отдельных людей, возглавляющих OCP-проекты. Пока стоимость участия в проекте для стартапов неизвестна. Утверждается, что она будет соответствовать уровню их финансовых возможностей. Приглашения будут направляться на основе «первичной оценки», а вопрос дальнейшего членства стартапов будет заново оцениваться ежегодно. Как заявляют в OCP, организация должна обеспечивать честный подход для всех, и цены для участников будут формироваться в соответствии с целом рядом критериев. Программа Startup Membership обеспечивает доступ к OCP Community для обеспечения связи с потенциальными партнёрами, клиентами и менторами. Также OCP поможет стартапам стать более заметными на рынке ЦОД и устранить технологические барьеры, сдерживающие их рост. Кроме того, OCP рассчитывает на привлечение к деятельности организации инвесторов, включая «бизнес-ангелов», а также подразделений действительных членов OCP, занимающихся инвестициями. |
|