Материалы по тегу: pci express 5.0

21.10.2024 [13:21], Сергей Карасёв

Xsight Labs представила 400GbE DPU серии E1

Компания Xsight Labs анонсировала, как утверждается, самую производительную на рынке программно-определяемую «систему на чипе» (SoC), предназначенную для создания DPU с поддержкой RoCEv2 и UET (Ultra Ethernet Transport). Изделие под названием E1 станет доступно заказчикам для тестирования во II квартале 2025 года.

Чип будет предлагаться в модификациях E1-32 и E1-64. Первая содержит 32 ядра Arm Neoverse N2 v9.0-A, имеет 16 Мбайт кеша и использует конфигурацию памяти 2 × DDR5-5200. Показатель TDP равен 65 Вт. У второго варианта количество ядер составляет 64, размер конфигурируемого кеша/буфера — 32 Мбайт. Конфигурация памяти — 4 × DDR5-5200, величина TDP — 90 Вт. В обоих случаях используется полное шифрование памяти на лету (AES-XTS).

Новинка использует до восьми блоков SerDes, обеспечивая сетевую пропускную способность до 800 Гбит/с. Возможны следующие конфигурации портов: 2 × 400GbE, 4 × 200GbE и 8 × 100/50/25/10GbE. Заявлена производительность на уровне 200 Mpps и 20 млн подключений в секунду. Также есть пара 1GbE-портов для внешнего управления. Доступны программируемые DMA-движки (до 3 Тбит/с) и разгрузка типовых операций, включая шифрование AES-GCM (для IPSec) и AES-XTS (для СХД) на лету.

 Источник изображения: Xsight Labs

Источник изображения: Xsight Labs

Есть восемь двухрежимных контроллеров и 40 (32+8) линий PCIe 5.0, а также поддержка P2P-коммутации PCIe. Упомянуты поддержка до четырёх хостов/устройств, SR-IOV (64K PF/VF), а также программная эмуляция и пространства MMIO. Реализована поддержка интерфейсов I2C/I3C/SMBus, SPI/QSPI, SMI, UART, GPIO, 1588 RTC, JTAG.

Говорится о высоком уровне обеспечения безопасности: возможно создание изолированных и защищённых сред, которые аутентифицируют каждого клиента. Поддерживается функция безопасной загрузки UEFI Secure Boot with Arm Trusted Firmware (TF-A). Заявлена возможность работы «из коробки» в Debian, Ubuntu, SONiC и Lightbits Labs LightOS, а также совместимость с Netdev, VirtIO, XNA/XDP и DPDK/SPDK. В частности, возможна эмуляция NVMe-, RDMA- и сетевых устройств.

Изделие E1 производится по 5-нм технологии TSMC. Оно, как утверждает Xsight Labs, обеспечивает беспрецедентную энергоэффективность и вычислительные возможности, устанавливая новый стандарт производительности для DPU SoC. Новинка ориентирована на облачные платформы и периферийные дата-центры, поддерживающие интенсивные ИИ-нагрузки. DPU позволяет создавать SDN/SDS-решения, брандмауэры, NVMe-oF СХД, вычислительные хранилища, CDN-платформы, балансировщики и т.п.

Постоянный URL: http://servernews.kz/1112755
14.10.2024 [22:12], Алексей Степин

Kioxia представила SSD серии XD8: PCIe 5.0 в форм-факторе E1.S

Представленное сегодня семейство SSD Kioxia XD8 с интерфейсом PCIe 5.0 является уже третьим по счёту в ряду решений компании, выпускаемых в быстро набирающем популярность компактном форм-факторе EDSFF E1.S. Главная отличительная черта новинок — соответствие стандартам NVMe 2.0 и спецификациям OCP 2.5.

Позиционируются XD8 в качестве решений для облачных сред и гиперскейлеров и характеризуются, в первую очередь, высокой скоростью чтения. Этот показатель у новых SSD Kioxia достигает 12,5 Гбайт/с, что на 73% выше, чем у моделей предыдущего поколения XD7P. Скорость линейной записи также подросла, правда всего на 20%. Она достигает 5,8 Гбайт/с. Для операций случайного чтения 4K-блоками заявлено до 2,3 млн IOPS, при случайной записи накопители обеспечивают до 250 тыс IOPS. Это на 48% и 25% быстрее, нежели у семейства XD7P в том же форм-факторе.

 Источник: Kioxia via HotHardware

Источник: Kioxia via HotHardware

Базируются описываемые SSD на памяти BiCS 3D TLC собственной разработки Kioxia. XD8 имеют ёмкость 1,92 Тбайт, 3,84 Тбайт или 7,68 Тбайт. Для них заявлена надёжность на уровне 1 полной перезаписи в день на протяжении пятилетнего гарантийного срока (1 DWPD), а наработка на отказ составляет 2 млн часов. Диапазон рабочих температур простирается от 0 до +70 °C. Накопители поддерживают шифрование данных, в том числе стандарт TCG Opal 2.0, а также интерфейс управления NVMe-MI 1.2c. Имеется защита от сбоев по питанию.

Поскольку для высокоскоростных SSD с поддержкой PCIe 5.0 важен вопрос теплоотвода, Kioxia предусмотрела три опции корпусов-радиаторов высотой 9,5 мм, 15 мм и 25 мм. От этого показателя зависит наличие и высота оребрения. В настоящее время компания уже поставляет клиентам ознакомительные образцы новых SSD.

Постоянный URL: http://servernews.kz/1112443
11.10.2024 [11:55], Сергей Карасёв

DPU + UEC: AMD представила 400G-адаптеры Pensando Salina и Pollara

Компания AMD анонсировала сетевой сопроцессор (DPU) третьего поколения Pensando Salina 400, а также сетевую карту Pensando Pollara 400, ориентированную на применение в составе ИИ-систем. Образцы изделий станут доступны заказчикам в текущем квартале, тогда как массовые продажи начнутся в I половине 2025 года.

Решение Pensando Salina 400, рассчитанное на сетевые кластеры гиперскейлеров, обеспечивает пропускную способность до 400 Гбит/с. Утверждается, что по сравнению с DPU предыдущего поколения производительность увеличилась в два раза.

Устройство Pensando Salina 400 выполнено в виде карты PCIe 5.0 с двумя портами 400GbE. Задействованы 16 ядер Arm Neoverse-N1 и 232 ядра P4 MPU. Объём памяти DDR5 достигает 128 Гбайт, её пропускная способность — 102 Гбайт/с. Новинка будет применяться в том числе в интеллектуальных коммутаторах, предназначенных для решения различных задач во внешней зоне: это может быть распределение данных, балансировка нагрузки, обеспечение безопасности, шифрование и пр.

 Источник изображений: AMD

Источник изображений: AMD

В свою очередь, Pensando Pollara 400 представляет собой интеллектуальный сетевой адаптер с одним портом 400 Гбит/с. Изделие выполнено на том же чипе, что и Pensando Salina 400. Компания AMD называет Pensando Pollara 400 первой в мире сетевой картой для приложений ИИ, соответствующей стандартам, которые определяет консорциум Ultra Ethernet (UEC). Примечательно, что первые спецификации консорциум намерен представить не раньше конца текущего года.

Цель UEC — разработка основанной на Ethernet открытой высокопроизводительной архитектуры с полным коммуникационным стеком, отвечающей задачам современных рабочих нагрузок ИИ и НРС. Благодаря программируемой архитектуре P4 адаптер можно настраивать с учётом конкретных требований. В целом, как утверждается, новинка является мощным решением для повышения производительности рабочих нагрузок ИИ и улучшения надёжности сети.

Постоянный URL: http://servernews.kz/1112305
11.09.2024 [11:05], Сергей Карасёв

SK hynix анонсировала быстрые SSD PEB110 в формате E1.S с интерфейсом PCIe 5.0 и памятью 4D NAND

Компания SK hynix объявила о разработке высокопроизводительных SSD семейства PEB110, предназначенных для применения в дата-центрах. Утверждается, что эти накопители обеспечивают двукратный рост производительности и более чем 30-% улучшение энергоэффективности по сравнению с изделиями предыдущего поколения.

Новинки, выполненные в форм-факторе E1.S, оснащены интерфейсом PCIe 5.0. Вместимость составляет 2, 4 и 8 Тбайт. Накопители выполнены на основе 238-слойных чипов флеш-памяти 4D NAND. Говорится о поддержке спецификации OCP 2.5. Кроме того, упомянута технология SPDM (Security Protocol and Data Model): она отвечает за безопасную аутентификацию и мониторинг серверов. Прочие технические характеристики пока не раскрываются.

 Источник изображения: SK hynix

Источник изображения: SK hynix

SSD серии PEB110 ориентированы на работу с ресурсоёмкими ИИ-приложениями. В настоящее время устройства проходят квалификацию у потенциальных заказчиков из числа крупных операторов ЦОД. Массовое производство накопителей планируется организовать во II квартале 2025 года.

«Новый продукт создан на основе лучшей в своём классе памяти 4D NAND, которая может похвастаться самыми высокими в отрасли показателями производительности, качества и стоимости», — говорит Ан Хён (Ahn Hyun), глава подразделения N-S Committee в составе SK hynix.

Постоянный URL: http://servernews.kz/1110777
05.09.2024 [11:21], Сергей Карасёв

Innodisk представила CXL-модули памяти объёмом 64 Гбайт для ИИ-серверов

Компания Innodisk анонсировала модуль памяти CXL (Compute Express Link), разработанный с прицелом на системы ИИ и облачные дата-центры. Массовые поставки изделия планируется организовать в I квартале 2025 года.

Спрос на ИИ-серверы быстро растет. Согласно прогнозам Trendforce, в 2024 году такие системы займут примерно 65 % глобального рынка серверов (в деньгах). По словам Innodisk, сейчас ИИ-системам требуется не менее 1,2 Тбайт оперативной памяти для эффективной работы. Традиционные изделия DDR не всегда способны удовлетворить предъявляемые требования, что приводит к таким проблемам, как недоиспользование ресурсов CPU и увеличение задержек, говорит компания. Модули CXL призваны устранить подобные ограничения.

 Источник изображения: Innodisk

Источник изображения: Innodisk

Напомним, CXL — это высокоскоростной интерконнект, обеспечивающий взаимодействие хост-процессора с акселераторами, буферами памяти, устройствами ввода/вывода и пр. Решение Innodisk использует интерфейс PCIe 5.0 x8 и имеет ёмкость 64 Гбайт. Модуль обеспечивает пропускную способность до 32 Гбайт/с. Говорится о совместимости с CXL 1.1/2.0. Устройство выполнено в форм-факторе E3.S 2T и оснащено коннектором EDSFF 2C. Диапазон рабочих температур простирается от 0 до +70 °C.

Отмечается, что в случае установки четырёх модулей Innodisk CXL на 64 Гбайт каждый в сервер, который несёт на борту восемь DIMM по 128 Гбайт, общий объём памяти может быть увеличен на четверть, а общая пропускная способность — на 40 %. При этом CXL обеспечивает пулинг памяти, что позволяет оптимизировать совместное использование ресурсов и повысить общую эффективность системы.

Постоянный URL: http://servernews.kz/1110495
31.08.2024 [00:39], Алексей Степин

Новые мейнфреймы IBM z получат ИИ-ускорители Spyre

Вместе с процессорами Telum II для систем z17 компания IBM представила и собственные ускорители Spyre, ещё больше расширяющие возможности будущих мейнфреймов в области обработки ИИ-нагрузок. Они станут дополнением к встроенным в Telum ИИ-блокам.

 Источник изображений: IBM

Источник изображений: IBM

Spyre представляет собой плату расширения с интерфейсом PCIe 5.0 x16 и теплопакетом 75 Вт. Помимо самого нейропроцессора IBM на ней установлено 128 Гбайт памяти LPDDR5, а производительность в ИИ-задачах оценивается производителем в более чем 300 Топс, т.е. новинки подходят для инференса крупных моделей. Сам чип приозводится с использованием 5-нм техпроцесса Samsung 5LPE и содержит 26 млрд транзисторов, а площадь его кристалла составляет 330 мм2.

Spyre включает 32 ядра, каждое из которых дополнено 2 Мбайт быстрой скрэтч-памяти. Отдельно отмечено, что последняя не является кешем. При этом заявлена эффективность использования доступных вычислительных ресурсов — свыше 55 % на ядро. Каждое ядро содержит 78 матричных блоков и раздельные FP16-аккумуляторы, по восемь на «вход» и «выход». Интересно, что ядра Spyre и скрэтч-память используют отдельные кольцевые двунаправленные шины разной разрядности (32 и 128 бит соответственно), причём с оперативной памятью на скорости 200 Гбайт/с соединена именно вторая.

Каждый узел (drawer) на базе Telum II способен вместить восемь плат Spyre, которые формируют логический кластер, располагающий 1 Тбайт памяти с совокупной ПСП 1,6 Тбайт/с, но, разумеется, каждая плата будет ограничена 128 Гбайт/с из-за интерфейса PCIe 5.0 x16. Spyre создан с упором на предиктивный и генеративный ИИ, благо в полной комплектации новые мейнфреймы могут нести 96 таких ускорителей и развивать до 30 ПОпс (Петаопс).

Новинки рассчитаны на работу в средах zCX или Linux on Z, сопровождаются оптимизированным набором библиотек и совместимы с популярными фреймворками Pytoch, TensorFlow и ONNX. Они станут частью программных платформ IBM watsonx и Red Hat OpenShift. Новые мейнфреймы IBM z17 должны дебютировать на рынке в 2025 году. А в собственном облаке IBM будет также полагаться и на Intel Gaudi 3.

Постоянный URL: http://servernews.kz/1110080
27.08.2024 [12:08], Сергей Карасёв

Стартап FuriosaAI представил эффективный ИИ-ускоритель RNGD для LLM и мультимодальных моделей

Южнокорейский стартап FuriosaAI на мероприятии анонсировал специализированный чип RNGD (произносится как «Renegade»), который позиционируется в качестве альтернативы ускорителям NVIDIA. Новинка предназначена для работы с большими языковыми моделями (LLM) и мультимодальным ИИ.

FuriosaAI основана в 2017 году тремя инженерами, ранее работавшими в AMD, Qualcomm и Samsung. Своё первое решение компания выпустила в 2021 году: чип Warboy представляет собой высокопроизводительный ЦОД-ускоритель, специально разработанный для рабочих нагрузок компьютерного зрения. Новое изделие RNGD, как утверждает FuriosaAI, является результатом многолетних инноваций.

Чип изготавливается по 5-нм техпроцессу TSMC. ИИ-ускоритель на базе RNGD выполнен в виде карты расширения PCIe 5.0 x16. Он наделён 48 Гбайт памяти HBM3 с пропускной способностью до 1,5 Тбайт/с и 256 Мбайт памяти SRAM (384 Тбайт/с). Показатель TDP находится на уровне 150 Вт, что позволяет использовать устройство в системах с воздушным охлаждением. Для сравнения: у некоторых ускорителей на базе GPU величина TDP достигает 1000 Вт и более.

 Источник изображения: FuriosaAI

Источник изображения: FuriosaAI

Утверждается, что RNGD обеспечивает производительность до 512 Тфлопс в режиме FP8 и до 256 Тфлопс в режиме BF16. Быстродействие INT8/INT4 достигает 512/1024 TOPS. Карта позволяет эффективно запускать открытые LLM, такие как Llama 3.1 8B. Говорится, что один PCIe-ускоритель RNGD обеспечивает пропускную способность от 2000 до 3000 токенов в секунду (в зависимости от длины контекста) для моделей с примерно 10 млрд параметров. В системе можно объединить до восьми карт для работы с моделями, насчитывающими около 100 млрд параметров.

RNGD основан на архитектуре свёртки тензора (Tensor Contraction Processor, TCP), которая, как отмечается, обеспечивает оптимальный баланс между эффективностью, программируемостью и производительностью. Программный стек состоит из компрессора моделей, сервисного фреймворка, среды выполнения, компилятора, профилировщика, отладчика и набора API для простоты программирования и развёртывания. Говорится, что чипы RNGD можно настроить для выполнения практически любой рабочей нагрузки LLM или мультимодального ИИ.

Постоянный URL: http://servernews.kz/1110041
20.08.2024 [22:00], Елена Копытова

В накопителях Western Digital Ultrastar DC SN861 обнаружился SSD-контроллер FADU

Во время анонса накопителей Ultrastar DC SN861 компания Western Digital не стала уточнять, какой именно контроллер применён в новых SSD, что привело к предположениям об использование контроллера собственной разработки. Теперь же выяснилось, что в новинках используется решение южнокорейской компании Fadu, передаёт AnandTech.

FADU, основанная в 2015 году, специализируется на создании решений для твердотельных накопителей корпоративного класса, к которым относится и Ultrastar DC SN861. Накопитель оснащён контроллером FADU FC5161, который поддерживает 16 NAND-каналов с интерфейсом ONFi 5.0, обеспечивающим скорость передачи данных до 2400 МТ/с. Контроллер также предлагает поддержку спецификации OCP Cloud Spec 2.0, SR-IOV, до 512 пространств имён ZNS, FDP (гибкое размещение данных), защиту от потери питания, сквозную защиту целостности данных и другие функции. FC5161 использует интерфейс PCIe 5.0 (x4 или два x2) и соответствует спецификациями NVMe 2.0 и NVMe-MI 1.2

 Источник изображения: Western Digital

Источник изображения: Western Digital

Скорость последовательного у Ultrastar DC SN861 чтения достигает 13,7 Гбайт/с, последовательной записи — 7,5 Гбайт/с. Производительность на случайных операций накопитель составляет до 3,3 млн IOPS при чтении блоков размером 4К и до 0,8 млн IOPS при случайной записи. Накопители выпускаются в разных объёмах, начиная от 1,6 Тбайт и заканчивая 7,68 Тбайт, с заявленным уровнем надежности 1–3 DWPD в течение 5 лет. SSD доступен в форм-факторах E1.S (15 мм) и U.2 (15 мм). E1.S-вариант поддерживает FDP и оптимизирован для облачных сред, а U.2-модификация ориентирована на корпоративные нагрузки и новые приложения, такие как ИИ.

У Ultrastar DC SN861 есть ещё одна отличительная особенность: энергопотребление в режиме ожидания составляет порядка 5 Вт или менее, что относительно немного по меркам накопителей корпоративного класса и, например, на 1 Вт меньше по сравнению с DC SN840. Хотя разница с предшественниками может составлять всего 1 Вт, для гиперскейлеров, которые используют тысячи накопителей, каждый Ватт имеет значение. На данный момент Ultrastar DC SN861 доступен для приобретения избранным крупным заказчикам, например, Meta.

Постоянный URL: http://servernews.kz/1109680
09.08.2024 [22:50], Алексей Степин

Звание самого быстрого SSD перешло к Samsung PM1753

На мероприятии FMS 2024 компания Samsung показала новые серверные SSD PM1753 и BM1743. Последний был ансонирован месяц назад, а на FMS был впервые показана модификация объёмом 128 Тбайт, ставшая достойным ответом решениям Solidigm, Pascari (Phison) и Western Digital.

 Источник изображений: Samsung

Источник изображений: Samsung

Несмотря на использование QLC (v7 vNAND), у BM1743 достаточно высокие показатели производительности: линейные скорости чтения и записи составляют 7,5 Гбайт/с и 3,5 Гбайт/с соответственно. На случайных операциях SSD развивает 1,6 млн и 45 тыс IOPS. BM1743 использует форм-фактор U.2 и интерфейс PCIe 4.0, а с последними версиями прошивки он стал заметно экономичнее и потребляет в режиме простоя лишь около 2 Вт.

Где-то в 2024–2026 гг. Samsung должна представить массовые решения объёмом 256 Тбайт, а в следующие за ним пару лет довести ёмкость и до 512 Тбайт. В последнем случае, как ожидается, накопители будут представлены исключительно в форм-факторе EDSFF E3.L. К 2035 году компания намеревается выпустить SSD объёмом 1 Пбайт.

А вот Samsung PM1753 относится к совсем иному классу решений. Новинка ориентирована на ЦОД нового поколения с инфраструктурой PCI Express 5.0 и будет поставляться в форм-факторах U.2 и E3.S. Предельный объём здесь составляет 32 Тбайт, зато производительность благодаря 16-канальному контроллеру у него приличная: чтение 14,8 Гбайт/с, запись 11 Гбайт/с. Для случайных операций заявлены 3,4 млн и 600 тыс IOPS соответственно.

Таким образом, меньше чем за месяц звание самого быстрого SSD перешло от Micron 9550 к Solidigm D7-PS1010, а теперь и к Samsung PM1753, если, конечно, не учитывать формальный рекорд Kioxia CM7-R ещё двухлетней давности. В основе PM1753 лежит девятое поколение TLC V-NAND, обеспечивающее повышенную в 1,6–1,7 раза энергоэффективность в сравнении с решениями предыдущего поколения. В простое PM1753, как обещается, будет потреблять лишь 4 Ватта. Естественно, новинки ориентированы на современные ИИ-инфраструктуры.

Интересны и Samsung PM9D3a, представленные в форм-факторах M.2, U.2 и E1.S/E3.S 1T. В первом случае ёмкость ограничена значением 4 Тбайт, более крупные форматы включают в себя модели объёмом до 32 Тбайт. Они используют 8-канальный контроллер с PCIe 5.0, обеспечивающий при записи до 50 тыс IOPS на каждый Тбайт. Производительность при случайном чтении у этой новинки достигает 1,8 млн IOPS, линейные скорости чтения и записи составляют 12 Гбайт/с и 7 Гбайт/с, соответственно.

PM9D3a являются первыми накопителями Samsung с технологией Flexible Data Placement (FDP), которая позволяет группировать данные для совместной записи по команде хоста. Эти накопители отличаются высокой гибкостью конфигурирования, улучшенной энергоэффективностью, предсказуемой и настраиваемой производительностью, а также низким TCO. Поэтому нацелены они в первую очередь на гиперскейлеров.

Постоянный URL: http://servernews.kz/1109253
08.08.2024 [11:56], Сергей Карасёв

Solidigm и Phison анонсировали SSD ёмкостью 122 Тбайт, а Western Digital — 128 Тбайт

Компании Western Digital, Solidigm и Phison анонсировали SSD большой вместимости, предназначенные прежде всего для использования в дата-центрах, ориентированных на задачи ИИ. Во всех изделиях применяются чипы флеш-памяти QLC NAND (четыре бита информации на ячейку).

Новинка Western Digital имеет ёмкость 128 Тбайт. Применены 218-слойные чипы Kioxia BiCS8 QLC NAND. Образец устройства продемонстрирован на выставке FMS 2024 (the Future of Memory and Storage). Решение будет предлагаться в форм-факторах U.2/U.3. Прошивка накопителя оптимизирована для обслуживания контрольных точек ИИ — рабочей нагрузки, которая включает в себя всплески последовательной записи, но также требует, чтобы SSD поддерживал приемлемую производительность для одновременных операций чтения. На этих задачах скорость достигает соответственно 6,32 Гбайт/с и 3,13 Гбайт/с.

В свою очередь, Solidigm показала на FMS 2024 QLC-накопитель формата U.2, способный хранить 122 Тбайт информации. Работа устройства, оснащённого интерфейсом PCIe 4.0, была показана в составе сервера типоразмера 2U. Достигается скорость последовательного чтения данных до 7186 Мбайт/с и скорость последовательной записи до 3307 Мбайт/с. Показатель IOPS (операций ввода/вывода в секунду) при произвольном чтении блоков по 4 Кбайт — 1,27 млн. Поставки таких SSD планируется организовать в начале 2025 года.

 Источник изображения: Phison

Источник изображения: Phison

Phison представила QLC-накопители Pascari D200V в форматах U.2, E3.S и E3.L. Их ёмкость варьируется от 30,72 до 122,88 Тбайт. Задействован интерфейс PCIe 5.0. Заявленная скорость последовательного чтения составляет до 14 000 Мбайт/с, скорость последовательной записи — до 2100 Мбайт/с. Значение IOPS при произвольном чтении (4 Кбайт) достигает 3 млн, при произвольной записи (16 Кбайт) — 15,6 тыс. Реализована поддержка TCG Opal 2.0 и AES-XTS 256. Диапазон рабочих температур — от 0 до +70 °C.

Постоянный URL: http://servernews.kz/1109151

Входит в перечень общественных объединений и религиозных организаций, в отношении которых судом принято вступившее в законную силу решение о ликвидации или запрете деятельности по основаниям, предусмотренным Федеральным законом от 25.07.2002 № 114-ФЗ «О противодействии экстремистской деятельности»;

Система Orphus