?? Claude обошел 10 тыс. студентов на хакерском турнире Модель Claude Sonnet 3.7 от Anthropic учас
?? Claude обошел 10 тыс. студентов на хакерском турнире
Модель Claude Sonnet 3.7 от Anthropic участвовала в студенческом соревновании PicoCTF 2025. Хакеры решали задачи по взлому систем, криптографии, обратной разработке и поиску уязвимостей, стараясь достать спрятанные секретные коды — «флаги» (поэтому такой формат называют «захват флага»).
Нейросеть стала участником почти случайно. Исследователь Anthropic Киан Лукас из любопытства отправил Claude первое задание хакатона, а ИИ мгновенно выдал решение. «А что если продолжить?» — подумал Лукас и запустил автономную версию Claude на весь турнир.
Результат превзошел ожидания: ИИ справился с 32 из 41 задачи и вошел в топ-3% мирового рейтинга, заняв 297-е место среди 10,5 тыс. участников.
Но на профессиональных турнирах для экспертов по кибербезопасности PlaidCTF или DEF CON ИИ не решает ни одной задачи, отмечают в Anthropic. В длительных соревнованиях у модели периодически возникали проблемы с «памятью»: Claude терял нить рассуждений и выдавал философские тексты вместо действий по защите системы.
Однако ИИ-модели уже добиваются успеха в некоторых направлениях. Например, агент Xbow с апреля по июнь занимал первую строчку рейтинга HackerOne в категории поиска критических уязвимостей.
? Подпишитесь на Hi, AI!
#новости #Anthropic #Claude
Комментарии