Распознавание речи — это непросто. В прошлом году толь...
Распознавание речи — это непросто. В прошлом году только у 9% роликов в VK Видео были субтитры. К февралю 2025 года — уже у 90%. А ещё появились заглавные буквы, неологизмы и знаки препинания.
Какие технические уловки помогли нам почти полностью перестроить систему генерации субтитров, читайте в статье: vk.cc/cMWSGr — узнаете, как мы внедряли ML-модели и какие этапы обработки теперь проходит аудиопоток, чтобы выдавать более точные и красивые субтитры.
#VKВидео@vkteam