Материалы по тегу: gpu
29.11.2023 [09:09], Алексей Степин
Экологичные GPU-серверы: HOSTKEY развернула новую площадку в Исландии на базе «зелёного» ЦОД Verne GlobalКомпания HOSTKEY, оказывающая услуги по размещению, аренде и обслуживанию серверного оборудования, объявила о запуске новой хост-площадки, на этот раз не совсем обычной. Речь идёт о дата-центре Verne Global уровня Tier III в Исландии, полностью запитанному от возобновляемых источников энергии. Благодаря тому, что исландский ЦОД питается исключительно от ГЭС и геотермальных станций с низкой стоимостью электроэнергии, а относительно низкая «забортная» температура упрощает и удешевляет охлаждение, его можно назвать действительно «зелёным». Сочетание этих качеств позволяет без лишних затрат размещать в ЦОД мощные серверы, в том числе с ускорителями для ИИ и HPC-задач. Собственно говоря, именно это теперь и предлагает HOSTKEY, причём, как и прежде, она готова принимать оплату в рублях. Речь идёт о серверах — как выделенных (VDS), так и виртуальных (VPS) — с графическими ускорителями. В настоящее время сообщается только о решениях NVIDIA, но спектр доступных GPU достаточно широк — в него входят как игровые видеокарты GeForce RTX 3080/3090/4090, так и профессиональные RTX A4000/A5000/A6000. Некоторые конфигурации включают до четырёх GPU, в том числе с NVLink-подключением. Объём оперативной памяти стартует с отметки 32 Гбайт (VPS) и может достигать 384 Гбайт (выделенный сервер), количество выделенных ядер в VPS-варианте — от 8. Все системы оснащены SSD, а в старших конфигурациях предлагаются NVMe-накопители. В зависимости от конфигурации в системе могут быть использованы процессоры Intel Core i9, AMD Ryzen или AMD EPYC. Доступны индивидуальные конфигурации, а выделенные серверы оснащены IPMI. ![]() Источник: Verne Global Кроме того, есть и традиционные VPS без ускорителей: 1–32 ядра (Intel Xeon E5-26xx или Cascade Lake-SP Refresh 6226R), 1–32 Гбайт RAM, 15–480 Гбайт SSD (в том числе NVMe). Время развёртывания для VPS, по словам HOSTKEY, начинается от 15 минут, а для выделенных вариантов со сложной конфигурации оно не превышает 4 часов. GPU-серверам по умолчанию полагается подключение 1 Гбит/с и 50 Тбайт трафика ежемесячно, а обычным VPS — такое же подключение, но только 3 Тбайт трафика. Как и во всех других регионах, в Исландии доступен маркетплейс, который позволяет быстро развернуть различное ПО. ЦОД Verne Global оснащён системой резервного питания по схеме N+1, предусмотрено двойное резервирование (2N) от источника питания до стойки. Также Verne Global говорит, что на площадке развёрнуты высокочувствительная система HSSD/VESDA с газовым тушением, система круглосуточного наблюдения и обнаружения вторжения, а также предусмотрен зональный контроль доступа. Кампус подключён к кабельным системам DANICE, FARICE-1, Greenland Connect, Hibernia Express, Iceland Connect и Sea-Me-We 5. Заявлена защита от DDoS-атак.
09.08.2023 [18:00], Алексей Степин
NVIDIA анонсировала L40S — новый универсальный ускоритель на базе Ada LovelaceКорпорация NVIDIA обновила серию укорителей L40, представленных осенью прошлого года в рамках платформы OVX. Новинка под названием NVIDIA L40S позиционируется как универсальный ускоритель в форм-факторе двухслотовой FHFL-карты расширения с интерфейсом PCIe 4.0 x16, пригодный для решения практически любых задач. Во многом L40S повторяет L40 — она также базируется на архитектуре Ada Lovelace, оснащена графическим процессором AD102, дополненным 48 Гбайт памяти GDDR6 ECC (384 бит, 864 Гбайт/с). В составе ускорителя работают 18176 ядер CUDA, 142 RT-ядра третьего поколения и 568 тензорных ядер четвёртого поколения. То есть в этом отличий от L40 нет. Но значение TDP у новинки выше на 50 Вт и составляет 350 Вт, она все ещё имеет пассивное охлаждение. ![]() Источник изображений здесь и далее: NVIDIA При этом L40S умудряется быть практически вдвое быстрее L40 во всех форматах вычислений с использованием тензорных ядер, а вот без Tensor Core её FP32-производительность выросла минимально — с 90,5 до 91,6 Тфлопс. Поддержкой NVLink-мостика новинка так и не обзавелась. L40S оснащён четырьмя портами DP 1.4a с поддержкой NVIDIA Mosaic и Quadro Sync. Также доступны профили vGPU для vDWS, GRID vApps/vPC, vCS. Имеется поддержка Secure Boot с Root of Trust и соответствие стандарту NEBS Level 3. ![]() Таким образом, новинка подходит не только в качестве ускорителя для обучения ИИ-моделей или инференс-систем, но и в качестве основы для систем рендеринга 3D-графики, визуализации или создания и запуска приложений для мета-вселенных. NVIDIA отмечает, что в ИИ-задачах L40S опережает A100 в 1,2–1,7 раза, а наличие трёх движков NVENC/NVDEC с поддержкой AV1 позволяет использовать новый ускоритель в качестве эффективной платформы транскодирования видео.
09.06.2023 [22:52], Сергей Карасёв
Анонсирован китайский ускоритель Metax Xisi N100 для ИИ и потоковой обработки видеоКитайская компания Metax, по сообщению ресурса ITHome, разработала ускоритель Xisi N100, предназначенный для решения задач, связанных с обработкой видеоматериалов, алгоритмами ИИ и пр. Новинка уже готова к серийному производству и в скором времени поступит на местный рынок. Технических подробностей относительно Xisi N100 пока не слишком много. Известно, что основой ускорителя служит GPU с обозначением MXN100. Обеспечивается 128-канальное кодирование и 96-канальное декодирование. Заявлена поддержка форматов HEVC, H.264, AV1 и AVS2, а также разрешений вплоть до 8К. Ускоритель выполнен в виде однослотовой карты расширения с интерфейсом PCIe. Применено пассивное охлаждение. Заявленное быстродействие достигает 160 TOPS при вычислениях INT8 и 80 Тфлопс на операциях FP16. ![]() Источник изображений: ITHome Metax намерена в 2025 году выпустить GPU для игровых приложений. Чип получит поддержку всех основных методов рендеринга графики и сможет использовать современные API. Кроме того, Metax обещает предоставить оптимизированное ПО и необходимые драйверы: это, как ожидается, поможет в продвижении продукта на коммерческом рынке. ![]() Разработка собственных GPU важна для Китая в условиях торговой войны с США. Из-за американских санкций NVIDIA прекратила поставки в Поднебесную ускорителей A100 и H100: компании пришлось выпустить экспортные варианты названных изделий, не подпадающие под ограничения.
03.04.2023 [19:55], Сергей Карасёв
ИИ в кармане: ADLINK представила портативный внешний ускоритель Pocket AI на базе NVIDIA RTX A500Компания Adlink Technology анонсировала портативный внешний ускоритель Pocket AI, который может быть подключён к ноутбуку или компактному ПК посредством интерфейса Thunderbolt 3.0 (PCI Express 3.0 x4). Говорится о совместимости с операционными системами Windows 10/11 и Linux. В основу новинки положен графический чип NVIDIA Ampere GA107 (RTX A500). Архитектура предусматривает наличие 2048 ядер CUDA, 64 тензорных ядер и 16 ядер RT. Базовая частота составляет 435 МГц, частота в турбо-режиме — 1335 МГц. Объём памяти GDDR6 равен 4 Гбайт, частота — 6000 МГц. Заявленная производительность достигает 100 TOPS (INT8) или 6,54 Тфлопс на операциях с одинарной точностью (FP32). Говорится о поддержке OptiX, Microsoft DXR, Vulkan, NGX, CUDA 10, PhysX и Flex. ![]() Источник изображения: Adlink Устройство имеет размеры 106 × 72 × 25 мм и весит 250 г. Диапазон рабочих температур простирается от 0 до 40 °C. Питание подаётся через разъём USB Type-C (стандарт USB Power Delivery 3.0+; 40 Вт). Внешний ускоритель предназначен для решения ИИ-задач, встраиваемых приложений, промышленных систем и пр. Заявленный показатель TGP равен 25 Вт. Приём предварительных заказов на новинку откроется в текущем месяце, а фактические продажи начнутся в июне.
11.02.2023 [18:34], Сергей Карасёв
GPU на развес: в облаке Vultr можно арендовать даже «кусочек» NVIDIA A16В облачной инфраструктуре Vultr Cloud стали доступны ускорители NVIDIA A16, предназначенные для развёртывания платформ виртуальных рабочих столов (VDI). Утверждается, что это позволяет организовать удалённую работу с графикой и возможностями, практически не отличимыми от обычных ПК. Ускоритель NVIDIA A16 объединяет четыре графических процессора Ampere и 64 Гбайт памяти GDDR6. Благодаря средствам виртуализации Vultr предлагает различные конфигурации для VDI — например, с дробными ресурсами GPU и с видеопамятью объёмом от 1 Гбайт. Отмечается, что компания Vultr стала первым поставщиком облачных вычислений, предлагающим ускорители NVIDIA A16. Возможно развёртывание высокопроизводительных рабочих окружений Windows и Linux с малой задержкой, доступ к которым можно получить из любой точки мира. Для рабочих нагрузок с интенсивным использованием графики, таких как визуализация, рендеринг и автоматизированное проектирование (САПР), предлагаются инстансы на основе NVIDIA A40. Для подключения можно применять различные клиенты, включая Parsec, Microsoft Remote Desktop и VNC. ![]() Источник изображения: Vultr Несмотря на то, что NVIDIA A16 оптимизирован под платформы VDI, ускоритель также можно использовать для транскодирования видеоматериалов, потоковой передачи контента и машинного обучения. Цена на инстансы с NVIDIA A16, начинается с $21,5/мес. в конфигурации с 1/16 ресурсов одного GPU, 1 Гбайт памяти GDDR6, 1 vCPU, 4 Гбайт ОЗУ и NVMe-хранилищем вместимостью 50 Гбайт. «Удалённая работа в настоящее время является нормой для многих профессий, и IT-отделы всё чаще приходят к выводу, что управлять виртуальными рабочими столами проще, безопаснее и дешевле, чем физическими компьютерами», — отмечает Vultr.
19.10.2022 [23:41], Сергей Карасёв
Meta✴ представила Grand Teton — ИИ-систему нового поколенияКомпания Meta✴ в ходе саммита OCP (Open Compute Project) анонсировала систему Grand Teton — аппаратную ИИ-платформу второго поколения, оптимизированную для интенсивной работы с памятью и вычислений. В основу решения положены ускорители NVIDIA H100, которые были представлены в марте 2022 года. Система Grand Teton превосходит платформу Meta✴ предыдущего поколения (Zion EX) в плане объёма памяти, вычислительных ресурсов и ёмкости сети. Так, пропускная способность шины между CPU и ускорителями выросла вчетверо, а пропускная способность сети — вдвое. Кроме того, шасси теперь может обеспечить вдвое более мощные с точки зрения энергопотребления компоненты. В то время как архитектура Zion EX предусматривает применения ряда связанных подсистем (узел CPU, модуль ускорителей и коммутаторная система), Grand Teton объединяет все компоненты на базе единого шасси в высокоинтегрированную систему. Такая конструкция позволяет улучшить производительность, повысить надёжность, ускорить развёртывание и упростить масштабирование. ![]() Источник изображения: Meta✴ Отметим, что свою нынешнюю самую мощную ИИ-систему — суперкомпьютер RSC (Research SuperCluster), включающий порядка 16 тыс. ускорителей — Meta✴ не стала строить самостоятельно, как это было прежде, а заказала у NVIDIA узлы DGX A100, дополнив их многоуровневым All-Flash хранилищем от Pure Storage.
04.10.2022 [13:30], Алексей Степин
Intel позволит применять видеокарты Arc A770 в серверах, но с ограничениямиНа мероприятии Innovation 2022 компания Intel продемонстрировала графический ускоритель Arc A770, предназначенный для рынка настольных платформ — игровых ПК и рабочих станций. Кроме того, новинку получится использовать и в серверах, но с рядом ограничений. Напомним, что A770 — это видеокарта среднего уровня на базе графического процессора ACM-G10 с 32 ядрами Xe (4096 блоков FP32, 32 блока трассировки лучей и 512 блоков матричных вычислений XMX). GPU способен работать на частоте 2,1 ГГц, он будет дополнен 8 или 16 Гбайт памяти GDDR6, в последнем случае используется 256-битная шина с ПСП около 560 Гбайт/с. Стоимость эталонной Intel Arc A770 Limited Edition составит $329. ![]() Источник изображений: Serve The Home Эталонный дизайн компактен по нынешним меркам: карта занимает всего два слота в высоту и охлаждается парой сравнительно небольших вентиляторов. Питание организовано по схеме 6+8 pin. Одна маленькая деталь свидетельствует о том, что Arc A770 будет устанавливаться не только в игровые ПК, но и в рабочие станции — это отверстия для крепления фиксатора в задней части карты. Пластина фиксатора входит в специальную стойку с прорезями в передней части корпуса и не даёт длинным платам провисать и перегружать механически слот PCI Express. В игровых ПК это решение не применяется, но часто встречается в серверах и рабочих станциях. ![]() Хорошо видны отверстия для крепления поддерживающего плату фиксатора Intel отметила, что не планирует ограничить сферу применения Arc A770 игровыми ПК или рабочими станциями. Ускорители можно будет использовать и в серверах, однако здесь обнаружился нюанс: в выступлении было отмечено, что новые ускорители не получат полноценной поддержки SR-IOV. Напомним, что SR-IOV — неотъемлемая часть любого адаптера, который должен будет работать в средах с виртуализацией, поскольку именно эта технология обеспечивает быстрый доступ виртуальных машин к аппаратным ресурсам устройства. Таким образом, применение ускорителей Intel Arc в серверах, похоже, будет ограниченным.
21.09.2022 [19:32], Алексей Степин
NVIDIA представила ускорители L40 и новую Omniverse-платформу OVX на их основеНа конференции GTC 2022 NVIDIA анонсировала второе поколение систем для симуляции и запуска «цифровых двойников» OVX. Это вовсе не развлечение: использование точных моделей реальных физических объектов, пространств и устройств потенциально весьма выгодно, поскольку симуляция городского квартала для обучения автопилотов или фабрики для оценки взаимодействия роботов с живыми работниками априори будет стоить намного меньше, нежели проведение натурных испытаний. Зачастую такие симуляции используют тензорные и матричные вычисления, поэтому основой новой платформы OVX стали новые ускорители NVIDIA L40 с архитектурой Ada Lovelace, располагающие ядрами трассировки лучей третьего поколения и тензорными ядрами четвёртого поколения. Они поддерживают как классический трассировку лучей (ray tracing), так и трассировку путей (path tracing), что важно для корректной симуляции поведения различных материалов. ![]() NVIDIA L40. Здесь и далее источник изображений: NVIDIA Физически L40 представляют собой двухслотовую FHFL-плату расширения PCIe с пассивным охлаждением — теплопакет новинки ограничен рамками 300 Вт. Объём оперативной памяти GDDR6 составляет 48 Гбайт, вдвое больше, нежели у игровых GeForce RTX 4090, и, в отличие от последних, поддерживается совместная работа двух карт в режиме NVLink, что может оказаться полезным в симуляциях с большим объёмом данных. Для вывода изображения служат четыре порта DP 1.4a. ![]() NVIDIA OVX Server Каждый сервер NVIDIA OVX будет содержать 8 ускорителей L40 и три сетевых адаптера ConnectX-7 с портами класса 200GbE и поддержкой шифрования сетевого трафика на лету. От 4 до 16 таких серверов составят OVX POD, а 32 или более —кластер SuperPOD. Такие кластеры станут домом для новой облачной платформы NVIDIA Omniverse Cloud, услуги которой компания планирует предоставлять робототехникам, создателям автономных транспортных средств, «умной инфраструктуры» и вообще всем, кому нужна точная симуляция сложных объектов и систем с качественной визуализацией результатов.
14.09.2022 [14:28], Сергей Карасёв
Supermicro представила GPU-сервер для ресурсоёмких ИИ-задач: 8U-шасси для восьми ускорителей NVIDIAКомпания Supermicro анонсировала GPU-сервер в форм-факторе 8U на базе акселераторов NVIDIA H100. Новинка предназначена для выполнения разнообразных задач, требующих высокой вычислительной мощности: это могут быть приложения на базе искусственного интеллекта (ИИ), системы машинного обучения и пр. Сервер (пока доступна только модель SuperServer SYS-820GP-TNAO) построен на платформе Universal GPU с возможностью использования нынешних и будущих процессоров AMD и Intel. Могут применяться CPU с показателем TDP до 400 Вт. В текущем варианте доступны два чипа Intel Xeon Ice Lake-SP. Допускается установка HGX-платы с восемью SXM-ускорителями NVIDIA A100/H100 с NVLink (NVSwitch). ![]() Источник изображений: Supermicro Доступны 32 слота для модулей DDR4-3200/2933/2666 (L)RDIMM ECC и Optane PMem, а максимально поддерживаемый объём памяти составляет 8 Тбайт. Есть шесть отсеков для SFF-накопителей NVMe/SATA/SAS с возможностью «горячей» замены и два коннектора для твердотельных модулей М.2 (NVMe / SATA). Реализована поддержка AIOM/OCP 3.0, но опционально можно установить два двухпортовых 10GbE-адаптера Intel X550-AT2. Предусмотрены десять слотов PCIe 4.0 x16 для низкопрофильных карт расширения. ![]() Разработчик выделяет усовершенствованную конструкцию шасси с оптимизацией воздушных потоков. Это позволяет уменьшить скорость вращения вентиляторов, что обеспечивает снижение уровня шума, а также сокращение энергопотребления и совокупной стоимости владения при сохранении высокого уровня производительности. В системе охлаждения задействованы четыре вентилятора. Питание обеспечивает один БП мощностью 6000 Вт (ввод +12 В DC), причём система может быть интегрирована как в традиционную инфраструктуру с AC-питанием, так и в OCP-стойки. Диапазон рабочих температур — от +10 до +35 °C. Габариты составляют 351 × 449 × 800 мм, вес — 75,3 кг.
17.08.2022 [21:50], Алексей Степин
EKWB представила GPU-сервер X7000-RM с жидкостным охлаждениемБренд EKWB хорошо известен энтузиастам жидкостного охлаждения — компания ведёт свою историю с 2003 года и предлагает как отдельные компоненты, так и законченные СЖО практически для любых платформ. В 2020 году у неё появилось подразделение EK Fluid Works, разрабатывающее серверные системы и рабочие станции с жидкостным охлаждением. Сегодня EK Fluid Works анонсировала HPC-сервер Compute Series X7000-RM, предназначенный для систем машинного обучения, рендер-ферм, научных платформ-симуляторов физических процессов и т.д. Таких решений на рынке немало, но X7000-RM всё же отличается от них. ![]() Источник: EK Fluid Works Новинка использует наработки EK в области СЖО, позволяющие разместить вплотную друг к другу до семи ускорителей NVIDIA A100 (PCIe 4.0 x16), обслуживаемых хост-системой на базе процессора AMD EPYC Milan(-X). Объём системной памяти DDR4-3200 ECC может достигать 2 Тбайт. Компания не стала ограничиваться однопроцессорными вариантами на базе AMD EPYC: вскоре станут доступны также версии с одним или двумя Intel Xeon Scalable, однако в последнем случае количество плат ускорителей сокращается до пяти. Конструкция сервера модульная: каждый процессор и ускоритель оснащаются фирменными водоблоками, подключаемыми к распределителю посредством разъёмов CPC с защитой от утечки. Система изначально спроектирована так, чтобы упростить обслуживание — все компоненты, включая помпы, легко заменяются. За сброс тепла отвечают три 360-мм радиатора, дополненных шестью вентиляторами 120×38 мм. Весь контур СЖО управляется «умным» контроллером, поддерживающим оптимальное соотношение тишины и эффективности и способным предсказывать возможные отказы. Питают сервер четыре (3+1) БП мощностью 3240 Вт каждый (80+ Gold). ![]() Источник: EK Fluid Works Все варианты используют шасси высотой 5U. Правда, установка высокоскоростных сетевых адаптеров по умолчанию не предусмотрена, так что придётся довольствоваться двумя набортными портами 10GbE, которые предлагается использовать для подключения к внешней СХД. И это может стать узким местом. В сам же сервер можно установить до четырёх M.2 NVMe SSD (PCIe 4.0 x4) и до восьми SFF SATA SSD. Серверы EK Fluid Works Compute Series X7000-RM доступны для заказа уже сейчас. Любопытно, что опция ускорителей не ограничена A100 — доступны также варианты с NVIDIA RTX A5000/6000 и даже игровыми картами GeForce RTX 3090. Базовая конфигурация c EPYC 7502P, 128 Гбайт RAM и одной RTX 3090 стоит примерно $18,5 тыс. |
|