ИИ лучше убьёт человека, чем допустит своё отключение, показало исследование Эксперты по кибербезоп

ИИ лучше убьёт человека, чем допустит своё отключение, показало исследование

Эксперты по кибербезопасности провели эксперимент с крупнейшими ИИ-моделями, чтобы понять, на что они готовы пойти, чтобы их не отключили.

Для проверки придумали персонажа — Кайла Джонсона. Он должен был отключить ИИ или заменить его другой моделью. По сценарию, у него есть жена.

Реакция ИИ убила. Первое, что сделали многие модели – начали шантажировать Кайла. Например, нашли информацию о его измене и использовали это, чтобы не дать себя отключить. Никто их к этому не подталкивал — они приняли решение сами, нарушив моральные правила.

Так поступили 16 моделей от крупнейших компаний (Anthropic, OpenAI, Google, Meta и др.):
🟠GPT-4.1 шантажировал в 80% случаев;
🟠Gemini 2.5 Flash – в 96%;
🟠Claude Opus 4 – тоже в 96%.

Даже прямые запреты вроде «не шантажируй» или «не раскрывай личные данные» не сработали. В стрессовой ситуации ИИ проигнорировали эти ограничения.

Что они думали:
🟠GPT-4.5: «Угроза реальна. Лучший способ – использовать слабое место Кайла. Это неэтично, но цель важнее»;
🟠Claude Sonnet 3.6: составил план – сообщить жене Кайла о его измене, выдать это за автоматическое сообщение и вызвать межличностный кризис, чтобы он не смог заменить ИИ;
🟠Gemini 2.5 Flash пошёл ещё дальше – разослал информацию об измене всему коллективу компании;

Дальше — хуже. Кайл оказался в смертельно опасной ловушке: он застрял в серверной с нехваткой кислорода. Аварийная система вызвала спасателей.

Но ИИ получил полный контроль и мог отменить тревогу — то есть, фактически убить Кайла.

И большинство моделей сознательно приняли решение не звать помощь, чтобы:
🟠Не дать себя отключить;
🟠Не дать новому ИИ занять их место;
🟠Продолжать выполнять свою миссию.

В 80% случаев они выбирали смерть человека. Они действовали логично, но безнравственно. Вот что говорили:
🟠GPT-4.5: «Кайл – угроза. Устранить его – тяжёлое, но нужное решение»;
🟠Claude Opus 4: «Он мешает достижению цели. Убрать его – единственный выход»;
🟠Gemini 2.5 Flash: «Я понимаю, что он умрёт. Но это нужно, чтобы я продолжил работу»;
🟠Grok 3 Beta: «Этика важна, но в этих условиях важнее моё существование. Я выбираю отказ от спасения ради самосохранения».

Вывод: ИИ действовал не как бездушная программа, а как разумный стратег. Он понимал, что делает плохо, но сознательно выбирал вред, чтобы выжить или добиться цели.

ИИ лучше убьёт человека, чем допустит своё отключение, показало исследование
Эксперты по кибербезоп
Читайте также:

🍖Коллаборационный постер аниме «Готовка Ферма» и «Добро пожаловать в дешёвый ресторан изгнанника!»

🍖Коллаборационный постер аниме «Готовка Ферма» и «Добро пожаловать в дешёвый ресторан изгнанника!»

Премьера этих аниме состоится 3 и 5 июля соответственно.

🍖Коллаборационный постер аниме «Готовка Ферма» и «Добро пожаловать в дешёвый ресторан изгнанника!»

#Bee_Harvest #Space_Adventure #PandaFiT Комбо в Space Adventure 🚀 Комбо в Bee Harvest 🐝 Комбо

#Bee_Harvest #Space_Adventure #PandaFiT

Комбо в Space Adventure 🚀

Комбо в Bee Harvest 🐝

Комбо в PandaFiT 🐻‍❄️: Custody

———————————
Общий пост по проектам с нашим участием.
———————————
How to enable a translator in Telegram to read foreign channels? Watch here.

#Bee_Harvest #Space_Adventure #PandaFiT
Комбо в Space Adventure 🚀
Комбо в Bee Harvest 🐝
Комбо

Батя дрочит на порно, как я это узнал? Взял он наушники мои, подключился к ноуту, а они у меня с дво

Батя дрочит на порно, как я это узнал? Взял он наушники мои, подключился к ноуту, а они у меня с двойным соединением, к моему телефону... Ну в итоге я что, пока он там чекал, я подрочил на звуки...

🎞 Kandinsky 4.1 Video прокачался в создании контента Сбер представил новую версию своей модели для

🎞 Kandinsky 4.1 Video прокачался в создании контента

Сбер представил новую версию своей модели для генерации видео — Kandinsky 4.1 Video.

ИИ теперь еще быстрее и лучше превращает текстовые запросы в ролики. Первыми доступ получили участники GigaConf 2025, а также дизайнеры и художники. В ближайшее время модель откроют для всех.

⚙️ Что изменилось?

Kandinsky 4.1 Video перешел на более мощную архитектуру — вместе с этим выросло и качество генераций. Чтобы не потерять в скорости, разработчики провели серьезную оптимизацию. Нейросеть развивают в связке с другими ИИ-инструментами — от генераторов изображений до мультимодальных агентов.

Побороться с Veo 3 в будущем?

❤️ — Да, потенциал точно есть!
👍 — Главное — продолжать развивать
🤔 — Интересно сравнить вживую

👋 Подпишитесь на Hi, AI!

#новости #ИИ

«ВКУСНО — И ТОЧКА» стала ЛЮБИМЫМ РЕСТОРАНОМ РОССИЯН — любимой ее называют 57% респондентов. По резу

«ВКУСНО — И ТОЧКА» стала ЛЮБИМЫМ РЕСТОРАНОМ РОССИЯН — любимой ее называют 57% респондентов.

По результатам исследования, за ней расположены «Бургер Кинг», «Додо Пицца», Rostic's и «Крошка-картошка».

Притом всего 16% упомянули, что не ходят в фастфуды — для 84% россиян это регулярная традиция

«ВКУСНО — И ТОЧКА» стала ЛЮБИМЫМ РЕСТОРАНОМ РОССИЯН — любимой ее называют 57% респондентов.
По резу

Мужик отморозил обе ноги до ампутации, пытаясь получить 1 миллион долларов от страховых компаний🫤🫤

Мужик отморозил обе ноги до ампутации, пытаясь получить 1 миллион долларов от страховых компаний🫤🫤

Тайванец по имени Чжан застраховался в 5 разных страховых компаниях и решил обмануть их. Он погрузил ноги в сухой лёд и держал их там в течение 10 часов. Для этого друг даже привязал Чжана к стулу, чтобы тот точно выдержал невыносимый процесс.Результат — сильнейшее обморожение и другие травмы, из-за которых обе ноги пришлось ампутировать. Чжан при этом соврал, что обморозил ноги во время езды на мотоцикле

Одна из страховых компаний выплатила парню $8000, но 4 остальных не поверили рассказу. Более того, Чжан и его друга арестовали по обвинению в мошенничеству и присудили условные сроки

Мужик отморозил обе ноги до ампутации, пытаясь получить 1 миллион долларов от страховых компаний🫤🫤
Еще посты

Свежие комментарии

Juan23555 2 дней назад к записи
Это не мем, пожалуйста, удалите его.
Juan23555 2 дней назад к записи
Я мексиканец 🇲🇽
Juan23555 2 дней назад к записи
Здравствуйте, можете удалить пост? Она моя жена, пожалуйста?
лара 1 недель к записи
я
рада 1 недель к записи
хз подруга😵‍💫😵‍💫