Сегодня 28 августа 2025
18+
MWC 2018 2018 Computex IFA 2018
реклама
Новости Software

Чат-бот Claude AI станет прекращать «вредоносные или оскорбительные диалоги с пользователями»

Anthropic научила свой чат-бот Claude AI прекращать общение, которое он сочтёт «вредоносным или оскорбительным». Эта возможность уже доступна в моделях Opus 4 и 4.1. Она позволит чат-боту завершать разговоры в качестве крайней меры после неоднократных попыток пользователя сгенерировать вредоносный или оскорбительный контент. Anthropic хочет добиться «потенциального благополучия» моделей ИИ, прекращая беседы, в которых Claude испытывает «явный дискомфорт».

 Источник изображения: Anthropic

Источник изображения: Anthropic

После прекращения диалога со стороны Claude, пользователь не сможет отправлять новые сообщения в этом чате, но создание новых чатов будет по-прежнему доступно. Anthropic отметила, что разговоры, вызывающие подобную реакцию, являются «крайними случаями», добавляя, что большинство пользователей не столкнутся с этим препятствием даже при обсуждении спорных тем.

В ходе тестирования Claude Opus 4 у чат-бота было отмечено «стойкое и последовательное отвращение к причинению вреда», в том числе к созданию сексуального контента с участием несовершеннолетних, насильственным действиям и терроризму. В этих случаях, по данным Anthropic, Claude демонстрировал «явную тревожность» и «тенденцию прекращать вредоносные разговоры, когда предоставлялась такая возможность».

Claude получил прямое указание не завершать разговоры, если пользователь проявляет признаки желания причинить «неминуемый вред» себе или другим. В таких случаях Anthropic привлекает онлайн-сервис кризисной поддержки Throughline, чтобы помочь разработать ответы на запросы, связанные с самоповреждением и психическим здоровьем.

На прошлой неделе Anthropic обновила политику использования своего чат-бота, поскольку быстро развивающиеся модели ИИ вызывают всё больше опасений по поводу безопасности. Теперь компания запрещает использовать Claude для разработки биологического, ядерного, химического или радиологического оружия, а также для разработки вредоносного кода или эксплуатации уязвимостей сети.

Источник:

Если вы заметили ошибку — выделите ее мышью и нажмите CTRL+ENTER.
Материалы по теме

window-new
Soft
Hard
Тренды 🔥
«Самая совершенная в истории серии»: Electronic Arts раскрыла окончательные системные требования Battlefield 6 и показала трейлер ПК-версии 22 мин.
Автосохранение в Microsoft Word теперь включено по умолчанию — но копии сохраняются не на ПК 2 ч.
В Elden Ring Nightreign скоро появятся экспедиции повышенной сложности — анонсирован режим Deep of Night для самых смелых 2 ч.
Нелинейный шутер Judas от создателя BioShock вернулся из небытия с новыми подробностями и ключевой иллюстрацией 3 ч.
Xiaomi представила HyperOS 3 — углубленная совместимость с Apple, редизайн, Super Island и многое другое 3 ч.
Apple добилась удаления приложение iTorrent из альтернативного магазина AltStore PAL 4 ч.
Представлен Avanpost CA — российский аналог Microsoft Certificate Authority 5 ч.
Capcom добавила в Resident Evil Requiem вид от третьего лица потому, что Resident Evil 7 оказалась «даже слишком страшной» 7 ч.
Новые меры по борьбе с киберпреступниками могут ударить по «белым хакерам» в России 7 ч.
Разработчик Dread Delusion анонсировал Entropy — олдскульную пошаговую ролевую игру про актёра театра, на мир которого напали демоны 8 ч.
Honor представила глобальную версию тончайшего складного смартфона Magic V5 — от €1999 в Европе 2 ч.
xMEMS Labs показала прототип умных очков с ультратонким динамиком и твердотельным кулером 3 ч.
Foxconn инвестировала более $200 млн в производство в Мексике, вероятно — для выпуска ИИ-серверов 4 ч.
В России стартовали продажи крайне доступного смартфона Infinix Smart 10 4 ч.
Tokyo Electron открестилась от участия в краже секретных разработок TSMC 4 ч.
AMD прекратила выпуск коробочных кулеров Wraith Prism и Wraith Spire для Ryzen 5000, 7000 и 8000G 4 ч.
В России обвалились продажи ноутбуков — россияне выбирают дешёвые модели и всё чаще предпочитают маркетплейсы 4 ч.
OKO Phone 5 для российских госслужащих поступил в продажу с устаревшей начинкой и свежей ОС «Аврора» 4 ч.
Можно пожёстче: российские производители предложили усложнить госзакупки иностранной электроники 4 ч.
Самолёт SolarStratos побил рекорд высоты полёта на солнечной тяге 6 ч.