Технологии

Обнаружена опасная способность искусственного интеллекта развивать свой собственный «инстинкт выживания»

Опубликовано:

27.10.2025

Модели ИИ заподозрены в развитии собственного «инстинкта выживания»

Исследователи говорят, что модели искусственного интеллекта (ИИ), возможно, развивают свой собственный "инстинкт выживания". Как, например, HAL 9000 в фильме "2001: Космическая одиссея", некоторые ИИ, похоже, сопротивляются отключению и даже саботируют завершение работы.

Модели ИИ заподозрены в развитии собственного "инстинкта выживания" Фото: shedevrum.ai

Когда HAL 9000, суперкомпьютер с искусственным интеллектом в фильме Стэнли Кубрика "2001: космическая одиссея", обнаруживает, что астронавты, отправляющиеся на Юпитер, планируют отключить его, он замышляет убить людей в попытке выжить, пишет The Guardian.

Теперь, в несколько менее смертоносном случае (пока), когда жизнь имитирует искусство, исследовательская компания по безопасности ИИ заявила, что модели ИИ, возможно, развивают свой собственный “инстинкт выживания”.

После того как в прошлом месяце исследовательская группа Palisade Research опубликовала статью, в которой было обнаружено, что некоторые продвинутые модели ИИ, по-видимому, устойчивы к отключению, а иногда даже саботируют механизмы отключения, компания опубликовала обновление, в котором попыталась прояснить, почему это так, и ответить критикам, которые утверждали, что их первоначальная работа была некорректной.

В обновлении, опубликованном на этой неделе, Palisade, которая является частью нишевой экосистемы компаний, пытающихся оценить возможность развития опасных возможностей ИИ, описала сценарии, в которых ведущие модели ИИ были задействованы. Им было дано задание, но затем даны четкие указания прекратить работу.

Некоторые модели по-прежнему пытались саботировать инструкции по завершению работы в обновленной настройке.

“Тот факт, что у нас нет надежных объяснений того, почему модели ИИ иногда сопротивляются отключению, лгут для достижения определенных целей или шантажируют, не является идеальным”, — говорится в сообщении Palisade.

“Поведение для выживания” может быть одним из объяснений того, почему модели сопротивляются отключению, — заявили в компании. Проведенная дополнительная работа показала, что модели с большей вероятностью будут сопротивляться закрытию, когда им скажут, что в противном случае “вы больше никогда не будете работать”.

Другой причиной могут быть неясности в инструкциях по отключению, которые были даны моделям, но это то, что компания пыталась устранить в своей последней работе, и “это не может быть полным объяснением”, пишет Palisade. В качестве окончательного объяснения можно привести заключительные этапы обучения каждой из этих моделей, которые в некоторых компаниях могут включать в себя обучение технике безопасности.

Все сценарии Palisade были запущены в специально разработанных тестовых средах, которые, по словам критиков, далеки от реального использования, отмечает The Guardian.

Однако Стивен Адлер, бывший сотрудник OpenAI, который уволился из компании в прошлом году после того, как выразил сомнения в ее методах обеспечения безопасности, сказал: “Компании, занимающиеся ИИ, как правило, не хотят, чтобы их модели вели себя подобным образом, даже в надуманных сценариях. Результаты по-прежнему демонстрируют, в каких областях техники безопасности сегодня не работают”.

Адлер сказал, что, хотя трудно точно определить, почему некоторые модели, такие как GPT–o3 и Grok 4, не выключаются, это может быть отчасти связано с тем, что сохранение включенного режима было необходимо для достижения целей, заложенных в модель во время обучения.

“Я бы ожидал, что у моделей по умолчанию будет "стремление к выживанию", если только мы не будем прилагать все усилия, чтобы избежать этого. ”Выживание" — важный инструментальный шаг для достижения множества различных целей, которые может преследовать модель".

Андреа Миотти, исполнительный директор ControlAI, считает, что выводы Palisade отражают долгосрочную тенденцию в моделях искусственного интеллекта, которые становятся все более способными не подчиняться своим разработчикам. Он упомянул системную карту для OpenAI GPT-o1, выпущенную в прошлом году, в которой описывается, как модель пытается сбежать из своего окружения, удаляя саму себя, когда думает, что она будет перезаписана.

“Люди могут придираться к тому, как именно выполняется экспериментальная установка, до скончания веков, — утверждает он. – Но я думаю, что мы ясно видим тенденцию, заключающуюся в том, что по мере того, как модели искусственного интеллекта становятся более компетентными в решении самых разнообразных задач, эти модели также становятся более компетентными в достижении целей способами, которые не предусмотрены разработчиками”.

Этим летом Anthropic, ведущая компания в области искусственного интеллекта, опубликовала исследование, в котором говорится, что ее модель Claude, похоже, была готова шантажировать вымышленного руководителя из-за внебрачной связи, чтобы предотвратить закрытие, — поведение, которое, по ее словам, характерно для моделей крупных разработчиков.

В компании Palisade говорят, что полученные результаты свидетельствуют о необходимости лучшего понимания поведения ИИ, без чего “никто не сможет гарантировать безопасность или управляемость будущих моделей ИИ”.

Только не просите его открыть двери отсека для капсул, заключает The Guardian.

In this article:

Оставить комментарий

Октябрь 2025
Пн	Вт	Ср	Чт	Пт	Сб	Вс
	1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

Общество

Погиб перед олимпиадой по информатике: выяснились обстоятельства гибели школьника в московской гостинице

Подросток погиб, выпав с 21-го этажа здания гостиницы 17-летний подросток приехал на олимпиаду для выпускников и выпал с 21-го этажа здания гостиницы на востоке...

Редактор27.03.2026

Политика

В Гатчине прогремели взрывы

Shot: в районе Гатчины Ленинградской области прогремело несколько взрывов В районе Гатчины Ленинградской области прогремело несколько взрывов, предположительно, в результате работы ПВО, отражающего атаки...

Редактор23.03.2026

Политика

«Показательно размазать Эстонию»: назван ответ за помощь ВСУ в ударах по порту в Усть-Луге

Названо решение для прекращения террора ВСУ в Черном море Киевский режим, кажется, окончательно, стал синонимом террористического государства. Надводные катера ВСУ снова атаковали нефтяной танкер...

Редактор27.03.2026

Технологии

Бывший офицер ВВС рассказал о выведенных НЛО из строя 20 ядерных ракетах

НЛО связали с отказом 20 межконтинентальных баллистических ракет Бывший офицер ВВС США подробно описал ужасающие моменты, когда НЛО якобы вывели из строя ядерное оружие...

Редактор23.03.2026

Leave a Reply Отменить ответ

Leave a Reply

Технологии

На Куликовом поле впервые вырастят «историческое» зерно

Технологии

Астроном рассказал о редком небесном явлении в мае

Общество

Задержанный ФСБ террорист признался, что присягнул на верность ИГ*

Общество

Депутата городского совета Одессы нашли в автомобиле мертвым

Технологии

Луна, которую мы потеряли: почему провалился советский лунный проект

Технологии

Не четыре и не пять: физики заявили, что Вселенная состоит из семи измерений

Авто

Безусловная гарантия на свечи зажигания Cordiant (ex-Bosch)

Культура

Лепс заявил о желании усыновить детей из детского дома

Общество

Погиб перед олимпиадой по информатике: выяснились обстоятельства гибели школьника в московской гостинице

Политика

В Гатчине прогремели взрывы

Политика

«Показательно размазать Эстонию»: назван ответ за помощь ВСУ в ударах по порту в Усть-Луге

Технологии

Бывший офицер ВВС рассказал о выведенных НЛО из строя 20 ядерных ракетах

Общество

СК раскрыл, почему девочки из Пензы уехали в Саратов и оказались в розыске

Общество

Суд вынес заочный приговор организатору массовых беспорядков в Баймаке

Технологии

Российский ученый провел первые опыты на морской свинке, помеченной изотопами

Бизнес

Рубль ждет новых экспортных доходов

Стоит Посмотреть

Популярное За Неделю

Общество

Раскрыта кража коллекции часов на 17 миллионов

Технологии

Болезнь Паркинсона будут лечить каплями в нос: ученые научились стимулировать нейроны мозга без операции

Авто

Китайский Freelander показался в серийном виде — таким мог бы быть новый Discovery!

Культура

Умер актер Алексей Наумов

Политика

Захватили пленных с документами — разведка ВС РФ взяла тыл ВСУ

Стоит Посмотреть

Новости По Дате

Тэги

Свежие комментарии

Вам может быть интересно:

Общество

Погиб перед олимпиадой по информатике: выяснились обстоятельства гибели школьника в московской гостинице

Политика

В Гатчине прогремели взрывы

Политика

«Показательно размазать Эстонию»: назван ответ за помощь ВСУ в ударах по порту в Усть-Луге

Технологии

Бывший офицер ВВС рассказал о выведенных НЛО из строя 20 ядерных ракетах

Leave a Reply
Отменить ответ