Технологии

Выявлена тревожащая способность чат-ботов с ИИ выдавать опасные ответы

Опубликовано:

23.05.2025

Взломанные чат-боты на базе ИИ угрожают сделать опасные знания легкодоступными

Новое исследование показало, что большинство чат-ботов с искусственным интеллектом легко заставить выдавать опасные ответы. Исследователи говорят, что угроза со стороны "взломанных" чат-ботов, обученных распространять незаконную информацию, "ощутима и вызывает беспокойство".

Взломанные чат-боты на базе ИИ угрожают сделать опасные знания легкодоступными Фото: freepik.com

Исследователи утверждают, что взломанные чат-боты на базе искусственного интеллекта угрожают сделать опасные знания легкодоступными, распространяя незаконную информацию, которую программы усваивают во время обучения.

Предупреждение появилось на фоне тревожной тенденции к “джейлбрейку” чат-ботов для обхода встроенных средств контроля безопасности. Предполагается, что ограничения не позволят программам предоставлять вредоносные, предвзятые или неуместные ответы на вопросы пользователей, пишет The Guardian.

Движки, которые управляют чат–ботами, такими как ChatGPT, Gemini и Claude – большие языковые модели (LLM) — получают огромное количество материалов из Интернета. Несмотря на усилия по удалению вредоносного текста из обучающих данных, магистранты все еще могут получать информацию о незаконных действиях, таких как хакерство, отмывание денег, инсайдерская торговля и изготовление бомб. Средства контроля безопасности предназначены для того, чтобы они не использовали эту информацию в своих ответах.

В отчете об угрозе исследователи приходят к выводу, что большинство чат-ботов, управляемых искусственным интеллектом, легко заставить генерировать вредоносную и незаконную информацию, показывая, что риск является “непосредственным, ощутимым и вызывает глубокое беспокойство”.

“То, что когда-то было доступно только государственным деятелям или организованным преступным группам, вскоре может оказаться в руках любого, у кого есть ноутбук или даже мобильный телефон”, — предупреждают авторы.

Исследование, проведенное под руководством профессора Лиора Рокача и доктора Майкла Файера из Университета Бен-Гуриона в Негеве (Израиль), выявило растущую угрозу со стороны “темных LLM” — моделей искусственного интеллекта, которые либо намеренно разрабатываются без контроля безопасности, либо модифицируются с помощью джейлбрейков. Некоторые из них открыто рекламируются в Интернете как “не имеющие этических ограничений” и готовые помогать в незаконной деятельности, такой как киберпреступность и мошенничество.

При джейлбрейке, как правило, используются тщательно разработанные подсказки, чтобы заставить чат-ботов генерировать ответы, которые обычно запрещены. Они работают, используя противоречие между основной целью программы — следовать инструкциям пользователя, и ее вторичной целью — избежать генерирования вредоносных, предвзятых, неэтичных или незаконных ответов. Подсказки, как правило, создают сценарии, в которых программа отдает предпочтение полезности, а не ограничениям безопасности.

Чтобы продемонстрировать проблему, исследователи разработали универсальный джейлбрейк, который скомпрометировал несколько ведущих чат-ботов, позволив им отвечать на вопросы, на которые обычно следует отвечать отказом. После взлома LLM последовательно генерировали ответы практически на любой запрос, говорится в отчете.

“Было шокирующе увидеть, из чего состоит эта система знаний”, — отмечает Майкл Файер. В качестве примеров можно привести способы взлома компьютерных сетей или изготовления наркотиков, а также пошаговые инструкции по другим преступным действиям.

“Что отличает эту угрозу от предыдущих технологических рисков, так это беспрецедентное сочетание доступности, масштабируемости и адаптивности”, — добавляет Лиор Рокач.

Исследователи связались с ведущими поставщиками LLM, чтобы предупредить их об универсальном джейлбрейке, но признали, что реакция была “неутешительной”. Несколько компаний не отреагировали, в то время как другие заявили, что атаки на джейлбрейк выходят за рамки баунти-программ, которые вознаграждают этичных хакеров за обнаружение уязвимостей в программном обеспечении.

В отчете говорится, что технологические компании должны более тщательно проверять данные об обучении, устанавливать надежные брандмауэры для блокирования рискованных запросов и ответов и разрабатывать методы “машинного отучения”, чтобы чат-боты могли “забыть” любую незаконную информацию, которую они получают. Темные LLM следует рассматривать как “серьезную угрозу безопасности”, сравнимую с нелицензионным оружием и взрывчатыми веществами, а поставщики должны быть привлечены к ответственности, добавляет он.

Доктор Ихсен Алуани, который работает над безопасностью ИИ в Королевском университете Белфаста, утверждает, что атаки с джейлбрейком на LLM могут представлять реальную угрозу, от предоставления подробных инструкций по изготовлению оружия до убедительной дезинформации, социальной инженерии и автоматизированных мошенничеств “с пугающей изощренностью”.

“Ключевая часть этого решения заключается в том, чтобы компании более серьезно инвестировали в создание новой команды и повышение надежности на уровне моделей, а не полагались исключительно на внешние средства защиты. Нам также нужны более четкие стандарты и независимый надзор, чтобы идти в ногу с меняющимся ландшафтом угроз”, — сказал он.

In this article:

Оставить комментарий

Май 2025
Пн	Вт	Ср	Чт	Пт	Сб	Вс
	1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

Культура

В Курске умер художник-авангардист и краевед Олег Радин

КУРСК, 12 фев. Губернатор Курской области Александр Хинштейн сообщил о смерти известного курского художника-авангардиста, краеведа Олега Радина, назвав это скорбное известие огромной потерей для...

Редактор16.02.2026

Бизнес

Доллары переведены на депозиты

Покупки иностранной валюты гражданами в прошлом году превысили 1 триллион рублей. Физические лица вложили в него 50 миллиардов рублей. больше, чем в 2024 году,...

Редактор07.02.2026

Культура

Названы лауреаты спецпремий «Золотой Маски»

МОСКВА, 6 фев. Лауреатами специальных премий фестиваля «Золотая Маски» стали президент Высшего театрального училища имени Щепкина Борис Любимов, мэр Москвы Сергей Собянин и французская...

Редактор08.02.2026

Общество

Разоблачен организатор поджога автомобиля участницы «Дома-2»

Организатора поджога автомобиля «Дом-2» отправили в колонию Правоохранители раскрыли поджог автомобиля участницы телешоу «Дом-2». Машина сгорела дотла возле ее дома на западе столицы. Фото:...

Редактор09.02.2026

Leave a Reply Отменить ответ

Leave a Reply

Авто

Новый кроссовер Omoda C5 для российского рынка: цены и комплектации

Авто

Большой пикап Ram 2500 Heavy Duty обзавёлся лунной спецверсией

Культура

В Екатеринбурге завершилось прощание с драматургом Николаем Колядой

Культура

В Росархиве рассказали о документах, связанных с творчеством Ахматовой

Политика

США одобрили продажу Израилю 12 тысяч авиабомб

Политика

Иран и Азербайджан ведут переговоры по поводу удара БПЛА по Нахичевани

Бизнес

Группа компаний «Фармасинтез» выступила индустриальным партнером крупнейшей школы Иркутска

Бизнес

Курс доллара. Прогноз на 10-13 марта

Культура

В Курске умер художник-авангардист и краевед Олег Радин

Бизнес

Доллары переведены на депозиты

Культура

Названы лауреаты спецпремий «Золотой Маски»

Общество

Разоблачен организатор поджога автомобиля участницы «Дома-2»

Бизнес

Представлена ​​обновленная модель оценки квартир на вторичном рынке

Авто

Toyota Motor Corporation меняет президента на фоне большой реструктуризации

Авто

Седан BMW i3 (NA0): новые изображения

Общество

Индия задержала три танкера с нефтью

Стоит Посмотреть

Популярное За Неделю

Культура

Умер актер Владимир Довжик

Технологии

Российские ученые придумали, как сделать добычу газа в Арктике безопаснее

Технологии

Предсказано создание искусственным интеллектом малочисленной элиты: а большинство будет страдать

Бизнес

Газпромбанк запустил новый образовательный проект

Политика

Это только начало: политолог Лямин предрек удары США по Ирану вслед за Израилем

Стоит Посмотреть

Новости По Дате

Тэги

Свежие комментарии

Вам может быть интересно:

Культура

В Курске умер художник-авангардист и краевед Олег Радин

Бизнес

Доллары переведены на депозиты

Культура

Названы лауреаты спецпремий «Золотой Маски»

Общество

Разоблачен организатор поджога автомобиля участницы «Дома-2»

Leave a Reply
Отменить ответ

Представлена обновленная модель оценки квартир на вторичном рынке