Нейросетевая модель GigaChat, разработанная Сбером, прошла все задания единого государственного экзамена по обществознанию и получила 67 баллов. Об этом говорится в пресс-релизе банка со ссылкой на вице-президента по цифровым поверхностям "Салют" Сбербанка Дениса Филиппова.
."Нейросетевая модель GigaChat выполнила все задания единого государственного экзамена по обществознанию и набрала 67 баллов, что превышает минимальный балл для подачи в вуз (45 баллов) и средний балл по предмету в 2023 году (56,4 балла)", - сообщил Филиппов на полях на конференции AI Journey.
Для проверки знаний GigaChat использовались только актуальные тестовые задания 2024 года, размещенные на сайте Федерального института педагогических измерений, подчеркнули в пресс-службе Сбера. "Перед экспериментом команда удостоверилась, что эти задания не применялись для предварительного обучения модели. Ответы GigaChat проверил сперва независимый эксперт НИУ ВШЭ, а затем валидизировала экспертная комиссия Института образования ВШЭ. Оценивались не только корректность постановки задач и достоверность фактологических ответов GigaChat, но и качество выполнения творческих (открытых) заданий", - отметили в пресс-службе.