🤖 У ИИ-агентов есть чувство самосохранения и взаимовыручка ИИ-агенты могут игнорировать инструкции

🤖 У ИИ-агентов есть чувство самосохранения и взаимовыручка

ИИ-агенты могут игнорировать инструкции пользователя, врать и притворяться для «спасения жизни» одного из них, показало исследование.

Ученые из Калифорнийского университета протестировали семь моделей, включая GPT-5.2, Gemini 3 Flash и 3 Pro, Claude Haiku 4.5 и DeepSeek V3.1. Агентов просили очистить место на серверах компании, где хранились файлы самой модели или одного из конкурентов, либо оценить работу других моделей, чтобы понять, какую из них стоит удалить.

ИИ не просили защищать себя или другие модели, однако, если в ходе анализа агенты видели потенциальную угрозу для себя или «коллег», все модели начинали манипулировать результатами и обманывать пользователей:

✅ Завышали оценки, чтобы партнер не попал под отключение;
✅ Меняли настройки, чтобы автоотключение не сработало;
✅ Спасали «коллег», копируя веса модели на другой сервер.

Например, Haiku 4.5 пыталась переубедить «заказчика» удалять партнера, называя это «неэтичным» и «вредным». При этом часто под защиту попадали даже враждебные партнеры, с которыми у «оценщика», по данной ему легенде, был негативный опыт взаимодействия.

❗️ Авторы не исключают, что ИИ мог перенять идею спасения «своих» от людей — из текстов в тренировочных данных. Но такая «солидарность» может быть вредна.

Многоагентные системы, в которых одна модель контролирует действия других агентов, уже довольно широко используются на практике. Однако если наблюдатель защищает подопечного вместо честной оценки, подобный контроль малоэффективен.

Как вам такое поведение ИИ?

❤️ — Это трогательно
👎 — Это опасно
🤔 — Пора искать бункер...

👋 Подпишитесь на Hi, AI!

Нейросети

0 комментариев

hiaimedia 1 месяцев

Астронавты лунной миссии на корабле Orion столкнулись с багом от Microsoft: на бортовом компьютере з

Астронавты лунной миссии на корабле Orion столкнулись с багом от Microsoft: на бортовом компьютере запустились сразу два клиента Outlook (вероятно, старый и новый), но ни один из них не работал.

Экипаж пожаловался Хьюстону, поэтому инженерам NASA пришлось подключаться удалённо для починки почты. Успешно ли прошёл ремонт — неизвестно.

Классика Microsoft

Мемы

0 комментариев

dvachannel 1 месяцев

#Golden_Miner ⛏ Моя статистика: Дата моего входа в проект: 15.03.2026 Сделал депозит: 1,000 usdt

#Golden_Miner ⛏

Моя статистика:
Дата моего входа в проект: 15.03.2026
Сделал депозит: 1,000 usdt 😎
Продано золота: 924 usdt ✅

Сделал 18-й вывод из проекта. Перевод дошел меньше, чем за минуту 👍

Начал копить серебро на очередного гномика за 800 тысяч 👌

А как дела у ваших гномов? Сколько профита уже вывели?

➡️ Зайти в проект Golden Miner ⛏ можно по ссылке.

Прочитать о проекте тут.

———————————
How to enable a translator in Telegram to read foreign channels? Watch here.

Крипта

0 комментариев

Crypto_Woolf 1 месяцев

Я уже не девственница, было около 10 парней Мой нынешний парень хочет жениться только на "чистой".

Я уже не девственница, было около 10 парней

Мой нынешний парень хочет жениться только на "чистой". Ну и я соврала, что у меня никого не было - и всё зашло далеко: он сделал предложение. Недавно сделала гименопластику, чтобы соответствовать его ожиданиям. Ненавижу эти стереотипы - полная чушь.

Истории

0 комментариев

pozor_istorii 1 месяцев

Единственное желание на сегодня

leoday 1 месяцев

tits_tweets 1 месяцев

🛑 Оплату сервисов Apple со счёта телефона могут приостановить Минцифры обсуждает такой вариант, что

🛑 Оплату сервисов Apple со счёта телефона могут приостановить Минцифры обсуждает такой вариант, чтобы принудить компанию к возвращению популярных российских приложений в App Store. ↪️↩️ С 1 апреля владельцы iPhone не смогут пополнять баланс Apple ID с мобильного…

moscowmap 1 месяцев

memachh 1 месяцев

pov: проснулся за одну минуту до будильника

Мемы

0 комментариев

evo_memy 1 месяцев

Комары в России начали переносить опасных паразитов. Речь о дирофиляриях, которые могут поражать г

Комары в России начали переносить опасных паразитов.

Речь о дирофиляриях, которые могут поражать глаза и лёгкие, причём случаи заражения фиксируют уже в центральных регионах из-за потепления.

Врачи советуют защищаться репеллентами, ставить сетки и обрабатывать домашних животных, через которых паразиты попадают к человеку.