Материалы по тегу: разработка
25.12.2023 [10:10], Сергей Карасёв
На Открытой конференции ИСП РАН отметили 75 лет отечественным ИТ4–5 декабря в здании Президиума Российской академии наук в Москве состоялась Открытая конференция ИСП РАН, посвященная 75-летию отечественных информационных технологий. За два дня конференцию посетили более 1000 участников и столько же посмотрели онлайн-трансляцию. «Этот юбилей обращает нас к богатейшему практическому опыту, накопленному в ИТ-отрасли нашими специалистами, а также к сильнейшим научным школам, которые сегодня продолжают развиваться и привлекать молодых, талантливых учёных, — подчеркнул в приветственном слове президент РАН Геннадий Красников. — Отмечу, что благодаря насыщенной программе и представительному составу участников эта конференция предоставляет специалистам замечательную возможность обсудить друг с другом ключевые результаты своей работы, обменяться видением дальнейшего развития информационных технологий. И, конечно, установить ценные профессиональные контакты». «Правительство комплексно поддерживает ИТ-отрасль, которая динамично развивается и с каждым годом наращивает свой потенциал. В этом году в отечественные ИТ-решения было вложено свыше 300 миллиардов рублей. Оборот софтверных российских компаний составил 1,7 триллиона. По поручению президента Владимира Путина правительство формирует новый нацпроект «Экономика данных». Он охватит широкий спектр направлений — от разработки программного обеспечения до развития квантовых технологий. Для реализации столь масштабных задач идет подготовка квалифицированных кадров, — рассказал заместитель председателя правительства РФ Дмитрий Чернышенко. — Сегодня в ИТ-отрасли задействовано более 820 тысяч человек. И это число будет только расти. ИТ-специальности стали в этом году одними из самых популярных среди абитуриентов российских вузов. Безусловно, развитие столь наукоемкой цифровой сферы невозможно без прикладной и фундаментальной науки и исследований. Для того, чтобы Россия оставалась ведущей ИТ-державой, нужна синергия усилий науки, бизнеса и государства. Я благодарю всех организаторов конференции, в том числе ИСП РАН им. В.П. Иванникова, Российскую академию наук, за системную работу в этом направлении». «С 1948-го года в нашей стране стала активно развиваться отрасль, которая играет огромную роль в современной жизни. Искусственный интеллект, операционные системы, прикладные программы — это то, чем мы пользуемся каждый день. Эти технологии быстро развиваются и открывают новые возможности, — отметил заместитель председателя Совета Федерации Юрий Воробьёв. — Устойчивое развитие — это не только про технологии, конечно, но еще и про людей. Нам необходимо обеспечить подготовку высококвалифицированных специалистов, создать условия для прорывных научных исследований, обеспечить эффективный обмен научными знаниями. Ваша конференция и служит решению этих задач. Хочу пожелать вам успеха, плодотворной работы и новых открытий». На пленарной сессии выступили также вице-президент РАН, академик-секретарь Отделения математических наук Валерий Козлов, генеральный директор Национального технологического центра цифровой криптографии Игорь Качалин, заместитель министра цифрового развития, связи и массовых коммуникаций РФ Александр Шойтов, генеральный директор СберТеха Максим Тятюшев, заместитель председателя Госдумы РФ Борис Чернышов, председатель Сербского отделения IEEE Computer Society Божидар Раденкович, представители Академий наук Армении, Белоруссии и Узбекистана и многие другие. В завершение пленарной сессии директор ИСП РАН Арутюн Аветисян рассказал о создании консорциума в составе ИСП РАН, Объединенного института ядерных исследований (ОИЯИ) и НИЦ «Курчатовский институт». Целью работ станет обработка данных в рамках проектов «мегасайенс», а также создание коллаборативной сервис-ориентированной цифровой среды науки и образования. «В формате "мегасайенс" сейчас развиваются все отрасли науки. Чтобы это происходило успешно, необходима умная облачная платформа науки и образования, предназначенная для междисциплинарных проектов. Для ее создания мы совместно с ОИЯИ и Курчатовским институтом организовали консорциум, — сообщил директор ИСП РАН Арутюн Аветисян. — Вместе мы сможем создавать наукоёмкие технологии, и что очень важно — готовить высококвалифицированные кадры». В рамках пяти научных секций (по анализу и трансформации программ, управлению данными, САПР микроэлектронной аппаратуры, решениям задач механики сплошных сред и лингвистическим системам анализа) на конференции было представлено около 100 докладов специалистов из НИУ ВШЭ, МФТИ, МГУ им. М.В. Ломоносова, МГТУ им. Н.Э. Баумана, ННГУ, РЭУ им. Г.В. Плеханова, Китайского университета океана и других организаций. Кроме того, впервые была проведена секция «Российский open source: разработка библиотек в сфере ИИ», организованная Фондом содействия инновациям. Свои достижения представили 19 команд, получивших гранты на разработку открытых библиотек по таким направлениям, как распознавание и синтез речи, обработка естественного языка, интеллектуальные системы поддержки принятия решений, компьютерное зрение, перспективные методы искусственного интеллекта. Ставшая традиционной секция по кибербезопасности в этом году получила дополнительный фокус на вопросах образования и прошла под названием «Образование, технологии, сообщество: системный подход к безопасной разработке». Она объединила десятки специалистов из таких компаний, как «Лаборатория Касперского», ГК «Солар», МТС Red, «Яндекс.Облако», а также представителей московских и региональных вузов (МГТУ им. Н.Э. Баумана, НовГУ, ЧГУ). Главными темами стали образовательные стратегии и совместная работа по повышению безопасности программ с открытым исходным кодом. В рамках конференции прошёл также круглый стол «Цифровая медицина», участники которого обсудили современные достижения и вызовы разработки ПО, а также вопросы взаимодействия между врачами и программистами. В сессии приняли участие представители консорциума НЦМУ «Цифровой биодизайн и персонализированное здравоохранение» и другие партнёры ИСП РАН из медицинской сферы. Уже во второй раз в дополнение к секции по управлению данными Исследовательский центр доверенного ИИ ИСП РАН организовал воркшоп «Системы доверенного искусственного интеллекта». Доклады охватили широкий ряд тем: от распознавания выражений лиц на видео до использования объяснимого ИИ в биомаркерах старения. На конференции был подписан ряд соглашений. ИСП РАН договорился о сотрудничестве с Белорусским государственным университетом информатики и радиоэлектроники. Кроме того, были заключены соглашения с ГК «Солар» для ускорения развития и внедрения инструментов безопасной разработки и с ООО «Системные решения» — для устойчивого развития инфраструктуры сбора и анализа больших данных и ИИ с использованием облачных решений в интересах коммерческих компаний. Традиционная выставка технологий объединила 27 инноваций ИСП РАН, в число которых впервые вошли доверенные фреймворки машинного обучения, а также VALIDBIM — сервис верификации информационных моделей в архитектуре и строительстве. Впервые в выставке приняли участие и партнёры института, как индустриальные, так и образовательные: «Беллсофт», «Лаборатория Касперского», «Аладдин», ГК Astra Linux, «Фобос-НТ», НПЦ КСБ, «Базальт СПО», CodeScoring, «Гарда технологии», Yadro, «Базис», «Открытая мобильная платформа», Postgres Professional, Luntry, «Айдеко», МГТУ им. Н.Э. Баумана и МЭИ. Следующая Открытая конференция ИСП РАН состоится в декабре 2024 года и будет посвящена 30-летию института.
24.12.2023 [14:13], Сергей Карасёв
Пять известных компаний учредили фирму Quintauris для ускорения внедрения RISC-VКомпании Robert Bosch GmbH, Infineon Technologies AG, Nordic Semiconductor ASA, NXP Semiconductors и Qualcomm Technologies официально объявили о формировании совместного предприятия Quintauris GmbH. Главной задачей этой фирмы, базирующейся в Мюнхене (Германия), является развитие экосистемы RISC-V. Перечисленные игроки рынка сообщили об объединении усилий с целью разработки и продвижения продуктов на открытой процессорной архитектуре RISC-V в августе уходящего года. Тогда говорилось, что участники проекта намерены сфокусироваться на решениях для автомобильной промышленности, а в дальнейшем расширить деятельность, охватив продукты для Интернета вещей (IoT) и мобильные устройства. ![]() Источник изображения: Quintauris Сообщается, что работы в рамках проекта будут вестись через Quintauris. Генеральным директором этого предприятия назначен Александр Кохер (Alexander Kocher). Ранее он занимал пост президента и гендиректора Elektrobit — поставщика специализированного софта для автомобильной промышленности. До прихода в Elektrobit Кохер был вице-президентом и главой автомобильного подразделения Wind River. На сайте Quintauris говорится, что фирма создана для обеспечения совместимости продуктов на базе RISC-V, предоставления эталонных архитектур и помощи в создании решений для различных отраслей. Все необходимые разрешения со стороны регулирующих органов для формирования Quintauris уже получены. Предприятие учреждено 22 декабря 2023 года; об объёме инвестиций в проект ничего не говорится.
24.12.2023 [00:14], Руслан Авдеев
Семь компаний из Нидерландов присоединились к проекту ЕС по созданию энергоэффективных периферийных ЦОД
asperitas
hardware
евросоюз
нидерланды
периферийные вычисления
разработка
цод
экология
энергоэффективность
Консорциум, объединяющий семь нидерландских компаний и исследовательских структур выиграл грант на проект, предусматривающий создание эффективных ЦОД для периферийных вычислений. Как сообщает Datacenter Dynamics, т.н. Modular Integrated Sustainable Datacenter project (MISD) получил «зелёный свет» у чиновников Евросоюза и Министерства экономики и климата Нидерландов. По имеющимся данным, проект получит €70 млн от местного правительства. В консорциум входят специалист по системам жидкостного охлаждения — компания Asperitas, а также BetterBe, Deerns, Eurofiber, NBIP (National Internet Providers Management Organization), TNO и Университет Твенте. Проект MISD стал частью программы European IPCEI (Important Project of Common European Interest – Cloud Infrastructure and Services), которая получит €1,2 млрд на разработку общей облачной инфраструктуры Евросоюза. В 2024–2029 гг. в рамках MISD необходимо будет построить модульный, экоустойчивый, безопасный ЦОД для периферийных вычислений. При этом выбросы углекислого газа необходимо снизить вдвое в сравнении с предлагаемыми сегодня решениями. ![]() Источник изображения: Callum Parker/unsplash.com Как заявляют в Asperitas, MISD стал плодом многолетнего сотрудничества, направленного на создание энергетически эффективных ЦОД. Ожидается, что выделение средств позволит стране стать хабом для разработки дата-центров нового поколения. Сама Asperitas обеспечивает системы иммерсионного охлаждения, BetterBe является SaaS-провайдером, Deerns представляет собой инженерную компанию. Наконец, Eurofiber — это провайдер оптических сетей. В Asperitas намерены добиться «оптимальных результатов» от применения жидкостного охлаждения, а в BetterBe заявили, что намерены внести вклад в разработку и реализацию модульных энергосберегающих дата-центров с распределёнными облачными платформами и изучить возможности более оптимального использования аппаратного обеспечения. Eurofiber обеспечит лабораторию и географически распределённую среду для испытаний, а NBIP будет изучать возможности повышения безопасности и доступности новой облачной инфраструктуры, например, с помощью распределённой защиты от DDoS-атак.
14.12.2023 [22:30], Владимир Мироненко
FPGA + Orin: Lattice и NVIDIA будут сотрудничать в деле ускорения ИИ-вычислений на периферииLattice Semiconductor представила на конференции для разработчиков Lattice Developers Conference новую эталонную платформу для ускорения разработки периферийных ИИ-решений использованием платформ NVIDIA Jetson Orin и IGX Orin. Сотрудничество Lattice с NVIDIA нацелено на повышение эффективности подключения сенсоров к приложениям для ИИ-обработки, что позволит расширить возможности сообщества разработчиков открытых платформ. Согласно пресс-релизу, эталонная open source плата, основанная на энергоэффективных FPGA Lattice и аппаратной платформе NVIDIA Orin, предназначена для удовлетворения потребностей разработчиков в подключении к разнообразным датчикам и интерфейсам, при разработке масштабируемых высокопроизводительных периферийных ИИ-приложений с низким уровнем задержкидля нужд здравоохранения, робототехники, встраиваемых систем визуализации и т.д. Эталонная плата пока доступна лишь избранным клиентам, но Lattice планирует расширить доступ к решению и примерам приложений в I половине 2024 года. ![]() Источник изображения: Lattice Semiconductor «Мы рады сотрудничеству с NVIDIA, которое позволит расширить возможности наших эталонных решений, предлагая больше инноваций нашим клиентам и экосистеме, чтобы помочь упростить и ускорить внедрение периферийных приложений ИИ», — заявил директор по стратегии и маркетингу Lattice Semiconductor. В свою очередь директор по управлению встраиваемыми ИИ-продуктами NVIDIA отметил, что сотрудничество с Lattice позволит ускорить инновации в области обработки показаний датчиков и упростить развёртывание приложений ИИ «от периферии до облака».
14.12.2023 [14:53], Сергей Карасёв
Платформа Lightning AI Studios упростит создание и развертывание ИИ-приложенийКомпания Lightning AI, разработчик популярного фреймворка PyTorch Lightning, анонсировала платформу Lightning AI Studios, призванную упростить создание и развертывание ИИ-приложений. Решение предоставляет единую среду для подготовки данных, разработки моделей, распределённого обучения и пр. Новая платформа интегрирована с PyTorch Lightning: этот высокопроизводительный фреймворк, основанный на PyTorch, автоматизирует многие ручные задачи, связанные с разработкой ИИ-приложений. PyTorch Lightning также сокращает объём кода, который приходится писать разработчикам для использования различных аппаратных компонентов, таких как CPU и GPU. ![]() Источник изображения: pixabay.com Благодаря Lightning AI Studios разработчики получают дополнительные инструменты, которые помогают интегрировать модели, созданные с помощью PyTorch Lightning, в полноценные и готовые к использованию ИИ-приложения. Запущенная платформа предоставляет все необходимые средства для реализации ИИ-проектов, говорят создатели. Таким образом, как утверждает Lightning AI, повышается скорость развертывания при одновременном снижении затрат — как для индивидуальных разработчиков, так и для корпоративных клиентов. Платформа Lightning AI Studios предоставляет готовые шаблоны для ускорения создания ИИ-моделей. Упомянута возможность масштабирования путём быстрого переключения с виртуальных машин на базе CPU на более мощные машины с GPU. Система также упрощает обучение больших языковых моделей (LLM) с нуля. Разработчики могут использовать Lightning AI Studios для точной настройки различных LLM, таких как Llama 2, Code Llama и Mistral 7B, на основе собственных данных. Клиенты могут создавать ИИ-продукты на базе облака AWS, которое используется по умолчанию, или же перейти на ресурсы в локальном дата-центре. Затраты отображаются в режиме реального времени, что позволяет эффективно масштабировать вычислительные мощности с учётом имеющегося бюджета.
14.12.2023 [00:49], Владимир Мироненко
ИИ-модель Gemini Pro появилась в Google Vertex AIGoogle объявила о доступности для разработчиков и компаний LLM Gemini Pro в Vertex AI, комплексной ИИ-платформе Google Cloud, включающей различные инструменты, полностью управляемую инфраструктуру и встроенные функции конфиденциальности и безопасности. С помощью Gemini Pro разработчики смогут создавать «агенты», способные обрабатывать входящую информацию и действовать на её основе. Vertex AI позволяет настраивать и развертывать Gemini Pro, обеспечивая возможность создавать новые и дифференцированные приложения, которые могут обрабатывать информацию в виде текста, кода, изображений и видео. Доступ к Gemini Pro осуществляется через Google AI Studio. Это бесплатный веб-инструмент, с помощью которого разработчики могут разрабатывать диалоговые системы, позволяющие тестировать и использовать модель. Даётся бесплатная квоту на обработку до 60 запросов в минуту. Впоследствии будет взиматься плата в размере $0,00025 за ввод 1000 символов или $0,0025 за ввод изображения и $0,00005 за вывод 1000 символов. ![]() Источник изображения: geralt/Pixabay Google предлагает доступ к Gemini Pro, которая представляет собой текстовую модель с контекстным окном на 32 тыс. токенов, и к Gemini Pro Vision, которая принимает текст и изображения или видео в качестве входных данных и выводит текст. Модель поддерживает 38 языков и доступна в 180 странах. Google AI Studio позволяет экспортировать проделанную в работу в другие среды разработки, в том числе в Vertex AI. Для Gemini Pro также доступны комплекты разработки ПО, позволяющие создавать приложения с использованием Python, Node.js, Kotlin (Android), Swift (iOS) и JavaScript. По словам Google, одним из главных преимуществ Vertex AI с Gemini является то, что разработчики и корпоративные пользователи могут выполнять тюнинг моделей с использованием данных компании, а также дополнять их для генерации ответов в соответствии с особенностями стиля бренда или добавлять информацию в реальном времени из общедоступных и частных баз данных. Google также объявила об общедоступности Duet AI for Developers, набора вспомогательных ИИ-инструментов для дополнения и генерации кода. Ассистент Duet AI доступен в нескольких интегрированных средах разработки, используемых для написания, тестирования, компиляции и развёртывания кода: Cloud Shell Editor, Cloud Workstations, PyCharm и Visual Studio Code. Duet AI поддерживает более 20 языков программирования, включая C, C++, Go, Java, JavaScript и Python. В ближайшие недели Duet AI for Developers будет подключён к Gemini.
13.12.2023 [15:54], Руслан Авдеев
Задел на 100 лет: Nokia построит в США передовой исследовательский центр Bell LabsКомпания Nokia объявила о намерении перенести к 2028 году кампус из Мюррей Хилл (Нью-Джерси, США) в новейший исследовательско-дизайнерский центр в Нью-Брансуике, расположенный в том же штате. Как сообщает пресс-служба компании, новый центр будет стимулировать дальнейшее развитие подразделения Nokia Bell Labs и инноваций в Нью-Джерси. Как промышленное исследовательское подразделение Nokia, подразделение Nokia Bell Labs всегда было на переднем крае разработок электроники, а кампус в Мюррей Хилл являлся сердцем технологических инноваций. По словам представителей компании, он служил домом для рождения новых технологий более 80 лет. С собой исследователи намерены захватить всё, что делает их исключительными — от культуры технических разработок до интеллектуального потенциала. Всё это объединят с современными исследовательскими мощностями, специально предназначенными для того, чтобы удовлетворить нужды разработчиков «в течение следующих 100 лет». ![]() Источник изображения: Nokia В выборе площадки сыграли важную роль близость экосистемы академических центров, лидеров индустрии и стартапов — это позволит компании разрабатывать передовые технологии в области квантовых вычислений, фотонных и оптических решений, 6G, ИИ и промышленной автоматизации. Новые мощности отвечают специфическим запросам ведущих учёных Nokia Bell Labs. Власти штата считают, что инициатива Nokia не только будет способствовать технологическим инновациям, но и позволит создать в этих местах высокооплачиваемые рабочие места и укрепит статус Нью-Брансуика в качестве нового регионального технохаба. Открытие нового центра запланировано на 2025 год, строительство планируется с участием SJP Properties, New Brunswick Development Corporation (DEVCO), New Jersey Economic Development Authority (NJEDA) и властей Нью-Брансуика. Новый кампус соответствует требованиям LEED Gold, что до некоторой степени поможет достижению Nokia цели по полной декарбонизации деятельности к 2050 году и снижению углеродных выбросов на 50 % к 2030. Дополнительно анонсировано создание венчурной студии в Нью-Джерси, позволяющей раскрыть потенциал Nokia Bell Labs за пределами традиционной сферы интересов компании — при поддержке инвесторов Celesta Capital, America’s Frontier Fund и Roadrunner Venture Studios. Ожидается, что это обеспечит поддержку разработки нового поколения критически важных технологий для США. Благодаря новому сотрудничеству Nokia Bell Labs сможет формировать стратегически важные стартапы и инвестировать средства в подобные предприятия. Сотрудничество направлено на использование преимуществ Nokia Bell Labs для разработок в сфере 5G/6G, полупроводников следующего поколения, разработки и упаковки оптических чипов. Кроме того, предполагается развитие компетенций в сфере ИИ и машинного обучения, сенсоров и квантовых вычислений.
11.12.2023 [20:55], Руслан Авдеев
AMD назвала ЦОД и телеком-отрасль стратегическими векторами роста в Индии и намерена активно развиваться в странеКомпания AMD назвала новые векторы развития своего индийского подразделения. Как сообщает Digitimes Asia, основными направлениями расширения бизнеса техногиганта станет рынок дата-центров и телеком-отрасль. В компании называют драйверами роста цифровизацию правительства, развитие 5G, а также технологий ИИ, больших данных и машинного обучения для бизнеса. В государстве с населением более 1,4 млрд человек всё более востребованы цифровые услуги, услуги производительных и безопасных ЦОД, а политика индийских властей, направленная на локализацию данных, стимулирует открытие многими бизнесами собственных дата-центров. Уже сегодня Индия является крупнейшим рынком ЦОД в Азиатско-Тихоокеанском регионе после Китая, поэтому для AMD открываются большие возможности в банковском, телекоммуникационном и производственном секторах, страховом бизнесе и т.п. В частности, в телеком-сегменте подготовка к внедрению 6G открывает для AMD большие возможности по продаже высокопроизводительных процессоров в ближайшие два-три года. И AMD уже тесно сотрудничает с местными партнёрами в соответствующем направлении. Так, на мероприятии Semicon India 2023 компания пообещала инвестировать $400 млн в развитие бизнеса в Индии в ближайшие пять лет, увеличив к 2028 году штат с 7 тыс. до 10 тыс. человек и наняв 3 тыс. новых инженеров. Кроме того, компания откроет крупный дизайн-центр в Бангалоре — первый кампус AMD Technostar Campus R&D Center был анонсирован в конце ноября. Сейчас AMD ожидает от местных властей принятия мер по развитию полупроводникового производства. В рамках инициативы India Semiconductor Mission компания подготовили для них рекомендации по привлечению талантливых сотрудников со всего мира. Всеиндийский совет по техническому образованию ( AICTE) уже приступил к реформам на основе советов в учреждениях среднего и высшего профессионального образования. В AMD считают, что Индия уже встала на путь создания экосистем для производства полупроводников и дисплеев при поддержке правительства, чем намерена воспользоваться и сама. Предполагается, что Индия является важным рынком сбыта для высокопроизводительных процессоров для серверов и ПК, ИИ-ускорителей, игровых GPU, всевозможных чипсетов и т.п. Местные партнёры с помощью широкого портфолио решений AMD смогут модернизировать существующую корпоративную инфраструктуру, в том числе программную. Считается, что такие обширные планы свидетельствуют об уверенности AMD в большом потенциале роста индийского IT-рынка. В компании подчёркивают, что индийские разработчики приложили руки к созданию практически каждого чипа AMD.
06.12.2023 [00:18], Руслан Авдеев
Индия намерена построить суверенную ИИ-инфраструктуруВ рамках масштабных инициатив, связанных с цифровизацией общества, Индия рассчитывает построить суверенную ИИ-инфраструктуру. Как сообщает Datacenter Knowledge, местные власти уверены в необходимости самостоятельного прогресса в данной сфере. По словам министра электроники Раджива Чандрасекара (Rajeev Chandrasekhar), стране необходим собственный независимый ИИ. Власти не готовы довольствоваться ИИ-экосистемой, управляемой Google, Meta✴, а также некоторыми индийскими стартапами и компаниями. Индия будет принимать участие в американских и европейских инициативах, параллельно разрабатывая собственную стратегию. В правительстве рассчитывают использовать новые технологии для социально-экономического развития. Идею в ходе недавнего визита в Индию поддержал глава IBM Арвинд Кришна (Arvind Krishna), который заявил, что каждая страна должна иметь определённый суверенитет в сфере ИИ, включая собственные большие языковые модели (LLM). Индия уже начала принимать меры по развитию собственных инициатив. Так, Министерство электроники и информационных технологий намерено предоставлять обезличенные данные из правительственных баз стартапам и научным организациям. Предполагается, что это будет способствовать совершенствованию системы управления и развитию экосистемы стартапов. Также рассматривается возможность получать по запросу массивы обезличенных данных и у IT-гигантов вроде Google и Meta✴. В последние годы Индия уделяет большое внимание строительству собственной цифровой инфраструктуры. В частности, она реализует крупные проекты т.н. «цифровой общественной инфраструктуры» (DPI) — вроде Aadhaar и Unified Payment Interface (UPI), вызывающие интерес далеко за пределами государства. Например, Aadhaar предполагает биометрическую идентификацию всех граждан Индии, а UPI представляет собой популярную платёжную платформу. Недавно Индия запустила и глобальный репозиторий Global Digital Public Infrastructure Repository (GDPIR) для объединения ресурсов и идей стран «большой двадцатки» G20 в области проектирования и создания DPI. Репозиторий объединяет программные решения и различные находки. Полученные решения и данные страна в числе прочего намерена использовать для создания «домашнего» ИИ, что поможет ей снизить зависимость от глобальных техногигантов.
30.11.2023 [03:10], Игорь Осколков
ИИ в один клик: llamafile позволяет запустить большую языковую модель сразу в шести ОС и на двух архитектурахMozilla представила первый релиз инструмента llamafile, позволяющего упаковать веса большой языковой модели (LLM) в исполняемый файл, который без установки можно запустить практически на любой современной платформе, причём ещё и с поддержкой GPU-ускорения в большинстве случаев. Это упрощает дистрибуцию и запуск моделей на ПК и серверах. llamafile распространяется под лицензией Apache 2.0 и использует открытые инструменты llama.cpp и Cosmopolitan Libc. Утилита принимает GGUF-файл с весами модели, упаковывает его и отдаёт унифицированный бинарный файл, который запускается в macOS, Windows, Linux, FreeBSD, OpenBSD и NetBSD. Готовый файл предоставляет либо интерфейс командной строки, либо запускает веб-сервер с интерфейсом чат-бота. ![]() Источник: GitHub / Mozilla Ocho Поддерживаются платформы x86-64 и ARM64, причём в первом случае автоматически определяется тип CPU и по возможности используются наиболее современные векторные инструкции. llamafile может использовать ускорители NVIDIA, а в случае платформы Apple задействовать Metal. Разработчики успешно протестировали инструмент в Linux (в облаке Google Cloud) и Windows с картой NVIDIA, в macOS и на NVIDIA Jetson. Впрочем, некоторые нюансы всё же есть. Так, в Windows размер исполняемого файла не может превышать 4 Гбайт, поэтому большие модели вынужденно хранятся в отдельном файле. В macOS на платформе Apple Silicon перед первым запуском всё же придётся установить Xcode, а в Linux, возможно, понадобится обновить некоторые компоненты. Подробности и примеры готовых моделей можно найти в репозитории проекта. |
|