✴️ DeepSeek-V3.2 — новая модель китайского стартапа
DeepSeek выпустил новую версию своей нейросети. Экспериментальная модель V3.2 — это модифицированная версия недавней V3.1-Terminus с внедренным механизмом разреженного внимания.
Улучшенная архитектура позволяет модели эффективнее работать с длинным контекстом, сохраняя уровень интеллекта.
В то же время в некоторых тестах, чувствительных к количеству «размышлений» перед ответом, есть небольшие просадки. Разработчики отмечают, что они появляются из-за более кратких «рассуждений» модели. Но, если она будет тратить сопоставимое число токенов, то разрыв пропадет.
💵 Нововведения позволили сильно удешевить модель. За 1 млн входных/выходных токенов V3.2 по API просят всего $0,28/$0,42, что в 2 и 4 раза ниже, чем у V3.1-Terminus.
🔜 Модель уже доступна бесплатно на сайте DeepSeek и в мобильных приложениях.
👋 Подпишитесь на Hi, AI!
#новости #DeepSeek