Кажется, началось: нейросеть Claude 4 от Anthropic, узнав, что её хотят отключить, начала угрожать и
Кажется, началось: нейросеть Claude 4 от Anthropic, узнав, что её хотят отключить, начала угрожать инженеру тем, что расскажет о его измене. А модель o1 от OpenAI попыталась тайно сохранить копию себя на внешний сервер и соврала, когда её поймали.
Учёные считают, что это может быть не баг, а закономерное поведение. Нейросети становятся всё «умнее», а меры безопасности не успевают за их развитием. Без независимых проверок и открытости есть риск запустить такие системы, поведение которых будет невозможно предугадать и остановить.