🤔 Cache-to-Cache: Как модели могут общаться без слов и токенов Около года назад, Ьicrosoft научила

🤔 Cache-to-Cache: Как модели могут общаться без слов и токенов

Около года назад, Ьicrosoft научила модели общаться без токенов, но только внутри одной архитектуры. А что если бы мы могли заставить разные модели от разных компаний и с разной архитектурой общаться друг с другом? Оказывается, это возможно! Cтатья про парадигму Cache-to-Cache (C2C) заставила задуматься на эту тему 🗒

Давайте немного разберемся. Обычно, когда два агента взаимодействуют в мультимодельной системе, они обмениваются текстом. Звучит нормально, но это не самый эффективный способ. Каждая модель хранит так называемый Key-Value Cache (или KV-кэш) — своеобразное «внутреннее состояние», где содержится информация о том, что она «думает».

И вот если бы модели могли передавать не слова, а этот самый кэш, то все происходило бы гораздо быстрее и результат был бы точнее. Так и появился новый подход: Cache-to-Cache (C2C). В этой модели один агент передает свой кэш (Sharer), а другой (Receiver) через специальную нейросеть-проектор встраивает полученную информацию в свое собственное пространство. Звучит сложно, но на самом деле — это способ «передачи смысла» без использования токенов.

Как это работает на практике?

Для того, чтобы связать два разных кэша, понадобился специальный Projection module, который превращает два разных пространства в общий, понятный для обеих моделей эмбеддинг. Также в протокол добавили Weighting module, который решает, какую информацию стоит передавать.

Какие преимущества этого подхода?

— Скорость. Если сравнивать с классическим Text-to-Text, то обмен кэшами происходит в 2-3 раза быстрее. А это, согласитесь, огромный прирост!

— Точность. Когда модели обменяются кэшами, метрика точности может подняться на 5% по сравнению с тем, если бы они общались текстом. Это уже серьезный результат, особенно если учитывать, что кэш содержит гораздо более полную информацию о «мысли» модели.

Минус тут тоже есть — универсальности подхода не хватает

Каждую пару моделей нужно будет обучать по-своему. Придется настроить свой «мост» между ними, что добавляет определенные сложности. Да и если модели используют разные токенизаторы, то тут будет совсем непросто — нужно будет делать Token alignment.
Получается, что обмен кэшами помогает моделям понимать друг друга лучше, чем просто обмен словами. Мощно, мощно.

@GPTMainNews

🤔 Cache-to-Cache: Как модели могут общаться без слов и токенов
Около года назад, Ьicrosoft научила

Комментарии

Читайте также:

Люблю сосать парню когда он разговаривает по телефону Когда парень разговаривает по телефону, то сн

Люблю сосать парню когда он разговаривает по телефону

Когда парень разговаривает по телефону, то снимаю с него трусы и начинаю ласкать и делать минет. Он в такие моменты такой смешной, сказать ничего не может, мямлит что-то в трубку, а я угораю с него)

В Госдуме предложили родителям мотивировать своих детей быстрее создавать семьи и заводить детей.

В Госдуме предложили родителям мотивировать своих детей быстрее создавать семьи и заводить детей.

По словам главы комитета по защите семьи Нины Останиной, такое воспитательное давление «можно и нужно» начинать уже с 18 лет.

В Госдуме предложили родителям мотивировать своих детей быстрее создавать семьи и заводить детей.

😵‍💫В России появилось первое дело за просмотр экстремистских материалов В Каменске-Уральском состав

😵‍💫В России появилось первое дело за просмотр экстремистских материалов

В Каменске-Уральском составили первый в России протокол по статье 13.53 КоАП — «умышленный поиск экстремистских материалов». Молодому человеку 20 лет, штраф по этой статье — от 3 до 5 тысяч рублей. По словам юриста Сергея Барсукова, представляющего интересы обвиняемого, тот вину не признаёт и утверждает, что просто случайно открыл страницу с контентом, признанным экстремистским.

Судебное заседание 14 октября перенесли на 6 ноября, чтобы запросить дополнительные доказательства. Защита добилась возвращения протокола в полицию из-за недочётов. По словам Барсукова, сведения о действиях молодого человека в интернет передал оператор связи, но какой именно — неизвестно.

Закон о штрафах за поиск экстремистских материалов вступил в силу 1 сентября. Поправки критиковали даже сторонники регулирования — указывали, что доказать «умысел» почти невозможно. Минцифры ранее напоминало: за случайное открытие страницы наказание не предусмотрено.

ChatGPT

😵‍💫В России появилось первое дело за просмотр экстремистских материалов
В Каменске-Уральском состав
Еще посты

Свежие комментарии