🥇 ИИ взял золото на Международной математической олимпиаде
Экспериментальная модель от Google DeepMind решила пять из шести задач на IMO — самом престижном международном математическом турнире для школьников. Результат ИИ — 35 из 42 баллов — соответствует уровню золотых медалистов: это 8-10% лучших участников.
✍️ Все в равных условиях
«Участница» олимпиады Gemini Deep Think запускает сразу несколько процессов рассуждений параллельно, как pro-модели OpenAI.
Нейросеть получала задания в том же виде, что и школьники, без какой-либо адаптации. На решение ИИ, как и школьникам, дали 4,5 часа без доступа в Интернет.
Результаты проверили эксперты IMO. «Решения были потрясающими во многих отношениях», — отметил президент IMO Грегор Долинар.
Важно, что это именно общая модель Gemini, доступ к которой позже дадут пользователям. В 2024 году Google тестировала на задачах IMO дуэт моделей AlphaProof и AlphaGeometry 2. Для них задачи пришлось формулировать на специальном языке программирования, и за три дня вместе модели решили четыре задачи — уровень серебряной медали.
🏆 Другие участники
Задачи IMO также решала новая модель от Harmonic AI — но стартап молчит до 28 июля. Организаторы попросили ИИ-компании подождать неделю после церемонии закрытия олимпиады, чтобы не отвлекать внимание публики от детей.
Здесь выделилась OpenAI. Новая «рассуждающая» модель компании показала результат на уровне Gemini, но огласили его еще 19 июля.
В IMO назвали действия стартапа «грубыми и неуместными» и отметили, что «золото» OpenAI под вопросом, так как независимое жюри не оценивало решения.
👋 Подпишитесь на Hi, AI!
#новости #Gemini #OpenAI