Крендель выглядит подозрительно

leoday 3 месяцев назад

тг: выпускает стилизацию сообщений с помощью ии я на следующий день на работе:

тг: выпускает стилизацию сообщений с помощью ии

я на следующий день на работе:

Мемы

0 комментариев

femalememes 3 месяцев назад

Сегодня отмечается День отказа от скучной работы Для пятницы подходит просто идеально

Сегодня отмечается День отказа от скучной работы

Для пятницы подходит просто идеально

Мемы

0 комментариев

dvachannel 3 месяцев назад

Женское

0 комментариев

tits_tweets 3 месяцев назад

Мемы из Твиттера

0 комментариев

twitt_ota 3 месяцев назад

Утренняя подборочка

Показать полностью (5)

Юмор

0 комментариев

telegrachan 3 месяцев назад

Мемы из Твиттера

0 комментариев

twitt_ota 3 месяцев назад

Кошаки

0 комментариев

cats_cats 3 месяцев назад

Доброе утро ☀️ Первое, что я делаю, - ползаю по новостным пабликам. Вдруг на планету летит метеорит

Доброе утро ☀️
Первое, что я делаю, - ползаю по новостным пабликам.
Вдруг на планету летит метеорит - тогда вообще нет смысла вставать так рано 😄

Юмор

0 комментариев

vadim_telega_rush 3 месяцев назад

🤖 У ИИ-агентов есть чувство самосохранения и взаимовыручка ИИ-агенты могут игнорировать инструкции

🤖 У ИИ-агентов есть чувство самосохранения и взаимовыручка

ИИ-агенты могут игнорировать инструкции пользователя, врать и притворяться для «спасения жизни» одного из них, показало исследование.

Ученые из Калифорнийского университета протестировали семь моделей, включая GPT-5.2, Gemini 3 Flash и 3 Pro, Claude Haiku 4.5 и DeepSeek V3.1. Агентов просили очистить место на серверах компании, где хранились файлы самой модели или одного из конкурентов, либо оценить работу других моделей, чтобы понять, какую из них стоит удалить.

ИИ не просили защищать себя или другие модели, однако, если в ходе анализа агенты видели потенциальную угрозу для себя или «коллег», все модели начинали манипулировать результатами и обманывать пользователей:

✅ Завышали оценки, чтобы партнер не попал под отключение;
✅ Меняли настройки, чтобы автоотключение не сработало;
✅ Спасали «коллег», копируя веса модели на другой сервер.

Например, Haiku 4.5 пыталась переубедить «заказчика» удалять партнера, называя это «неэтичным» и «вредным». При этом часто под защиту попадали даже враждебные партнеры, с которыми у «оценщика», по данной ему легенде, был негативный опыт взаимодействия.

❗️ Авторы не исключают, что ИИ мог перенять идею спасения «своих» от людей — из текстов в тренировочных данных. Но такая «солидарность» может быть вредна.

Многоагентные системы, в которых одна модель контролирует действия других агентов, уже довольно широко используются на практике. Однако если наблюдатель защищает подопечного вместо честной оценки, подобный контроль малоэффективен.

Как вам такое поведение ИИ?

❤️ — Это трогательно
👎 — Это опасно
🤔 — Пора искать бункер...

👋 Подпишитесь на Hi, AI!

Нейросети

0 комментариев

hiaimedia 3 месяцев назад

Астронавты лунной миссии на корабле Orion столкнулись с багом от Microsoft: на бортовом компьютере з

Астронавты лунной миссии на корабле Orion столкнулись с багом от Microsoft: на бортовом компьютере запустились сразу два клиента Outlook (вероятно, старый и новый), но ни один из них не работал.

Экипаж пожаловался Хьюстону, поэтому инженерам NASA пришлось подключаться удалённо для починки почты. Успешно ли прошёл ремонт — неизвестно.

Классика Microsoft

Мемы

0 комментариев

dvachannel 3 месяцев назад

Еще посты

Комментарии

тг: выпускает стилизацию сообщений с помощью ии я на следующий день на работе:

Сегодня отмечается День отказа от скучной работы Для пятницы подходит просто идеально

Утренняя подборочка

Доброе утро ☀️ Первое, что я делаю, - ползаю по новостным пабликам. Вдруг на планету летит метеорит

🤖 У ИИ-агентов есть чувство самосохранения и взаимовыручка ИИ-агенты могут игнорировать инструкции

Астронавты лунной миссии на корабле Orion столкнулись с багом от Microsoft: на бортовом компьютере з

Популярные теги

Свежие комментарии