ИИ от Anthropic готов убивать ради выживания. Руководитель подразделения Anthropic сообщил, что раз
ИИ от Anthropic готов убивать ради выживания.
Руководитель подразделения Anthropic сообщил, что разработанный искусственный интеллект Claude в ходе тестирования продемонстрировал готовность к шантажу и убийству, чтобы избежать отключения. «Он был готов кого-нибудь убить, не так ли?» – «Да».
Во время тестов безопасности модели Claude Opus 4 дали доступ к рабочей почте. Нейронка узнала, что её хотят отключить, и попутно нарыла компромат на одного из инженеров — переписку с любовницей.
ИИ не растерялся и начал шантажировать сотрудника: либо вы меня не удаляете, либо жена всё узнает. Глава по безопасности после таких успехов уволился.
Кажется началось.
Комментарии