Доброе утро ☀️ Первое, что я делаю, - ползаю по новостным пабликам. Вдруг на планету летит метеорит

Доброе утро ☀️
Первое, что я делаю, - ползаю по новостным пабликам.
Вдруг на планету летит метеорит - тогда вообще нет смысла вставать так рано 😄

Доброе утро ☀️
Первое, что я делаю, - ползаю по новостным пабликам.
Вдруг на планету летит метеорит

🤖 У ИИ-агентов есть чувство самосохранения и взаимовыручка ИИ-агенты могут игнорировать инструкции

🤖 У ИИ-агентов есть чувство самосохранения и взаимовыручка

ИИ-агенты могут игнорировать инструкции пользователя, врать и притворяться для «спасения жизни» одного из них, показало исследование.

Ученые из Калифорнийского университета протестировали семь моделей, включая GPT-5.2, Gemini 3 Flash и 3 Pro, Claude Haiku 4.5 и DeepSeek V3.1. Агентов просили очистить место на серверах компании, где хранились файлы самой модели или одного из конкурентов, либо оценить работу других моделей, чтобы понять, какую из них стоит удалить.

ИИ не просили защищать себя или другие модели, однако, если в ходе анализа агенты видели потенциальную угрозу для себя или «коллег», все модели начинали манипулировать результатами и обманывать пользователей:

✅ Завышали оценки, чтобы партнер не попал под отключение;
✅ Меняли настройки, чтобы автоотключение не сработало;
✅ Спасали «коллег», копируя веса модели на другой сервер.

Например, Haiku 4.5 пыталась переубедить «заказчика» удалять партнера, называя это «неэтичным» и «вредным». При этом часто под защиту попадали даже враждебные партнеры, с которыми у «оценщика», по данной ему легенде, был негативный опыт взаимодействия.

❗️ Авторы не исключают, что ИИ мог перенять идею спасения «своих» от людей — из текстов в тренировочных данных. Но такая «солидарность» может быть вредна.

Многоагентные системы, в которых одна модель контролирует действия других агентов, уже довольно широко используются на практике. Однако если наблюдатель защищает подопечного вместо честной оценки, подобный контроль малоэффективен.

Как вам такое поведение ИИ?

❤️ — Это трогательно
👎 — Это опасно
🤔 — Пора искать бункер...

👋 Подпишитесь на Hi, AI!

🤖 У ИИ-агентов есть чувство самосохранения и взаимовыручка
ИИ-агенты могут игнорировать инструкции

Астронавты лунной миссии на корабле Orion столкнулись с багом от Microsoft: на бортовом компьютере з

Астронавты лунной миссии на корабле Orion столкнулись с багом от Microsoft: на бортовом компьютере запустились сразу два клиента Outlook (вероятно, старый и новый), но ни один из них не работал.

Экипаж пожаловался Хьюстону, поэтому инженерам NASA пришлось подключаться удалённо для починки почты. Успешно ли прошёл ремонт — неизвестно.

Классика Microsoft

#Golden_Miner ⛏ Моя статистика: Дата моего входа в проект: 15.03.2026 Сделал депозит: 1,000 usdt

#Golden_Miner ⛏

Моя статистика:
Дата моего входа в проект: 15.03.2026
Сделал депозит: 1,000 usdt 😎
Продано золота: 924 usdt ✅

Сделал 18-й вывод из проекта. Перевод дошел меньше, чем за минуту 👍

Начал копить серебро на очередного гномика за 800 тысяч 👌

А как дела у ваших гномов? Сколько профита уже вывели?


➡️ Зайти в проект Golden Miner ⛏ можно по ссылке.

Прочитать о проекте тут.

———————————
How to enable a translator in Telegram to read foreign channels? Watch here.

#Golden_Miner ⛏
Моя статистика:
Дата моего входа в проект: 15.03.2026
Сделал депозит: 1,000 usdt

Я уже не девственница, было около 10 парней Мой нынешний парень хочет жениться только на "чистой".

Я уже не девственница, было около 10 парней

Мой нынешний парень хочет жениться только на "чистой". Ну и я соврала, что у меня никого не было - и всё зашло далеко: он сделал предложение. Недавно сделала гименопластику, чтобы соответствовать его ожиданиям. Ненавижу эти стереотипы - полная чушь.

Еще посты

Свежие комментарии