🤔 Cache-to-Cache: Как модели могут общаться без слов и токенов Около года назад, Ьicrosoft научила

🤔 Cache-to-Cache: Как модели могут общаться без слов и токенов

Около года назад, Ьicrosoft научила модели общаться без токенов, но только внутри одной архитектуры. А что если бы мы могли заставить разные модели от разных компаний и с разной архитектурой общаться друг с другом? Оказывается, это возможно! Cтатья про парадигму Cache-to-Cache (C2C) заставила задуматься на эту тему 🗒

Давайте немного разберемся. Обычно, когда два агента взаимодействуют в мультимодельной системе, они обмениваются текстом. Звучит нормально, но это не самый эффективный способ. Каждая модель хранит так называемый Key-Value Cache (или KV-кэш) — своеобразное «внутреннее состояние», где содержится информация о том, что она «думает».

И вот если бы модели могли передавать не слова, а этот самый кэш, то все происходило бы гораздо быстрее и результат был бы точнее. Так и появился новый подход: Cache-to-Cache (C2C). В этой модели один агент передает свой кэш (Sharer), а другой (Receiver) через специальную нейросеть-проектор встраивает полученную информацию в свое собственное пространство. Звучит сложно, но на самом деле — это способ «передачи смысла» без использования токенов.

Как это работает на практике?

Для того, чтобы связать два разных кэша, понадобился специальный Projection module, который превращает два разных пространства в общий, понятный для обеих моделей эмбеддинг. Также в протокол добавили Weighting module, который решает, какую информацию стоит передавать.

Какие преимущества этого подхода?

— Скорость. Если сравнивать с классическим Text-to-Text, то обмен кэшами происходит в 2-3 раза быстрее. А это, согласитесь, огромный прирост!

— Точность. Когда модели обменяются кэшами, метрика точности может подняться на 5% по сравнению с тем, если бы они общались текстом. Это уже серьезный результат, особенно если учитывать, что кэш содержит гораздо более полную информацию о «мысли» модели.

Минус тут тоже есть — универсальности подхода не хватает

Каждую пару моделей нужно будет обучать по-своему. Придется настроить свой «мост» между ними, что добавляет определенные сложности. Да и если модели используют разные токенизаторы, то тут будет совсем непросто — нужно будет делать Token alignment.
Получается, что обмен кэшами помогает моделям понимать друг друга лучше, чем просто обмен словами. Мощно, мощно.

@GPTMainNews

Нейросети

0 комментариев

GPT | ChatGPT | Midjourney — GPTMain News 8 часов назад

Прокуратура вызывала новака по нашему делу, когда не пришел, дали распоряжение полиции поискать его

Крипта

0 комментариев

givemetonru 8 часов назад

Формула-1, которую мы заслужили: коты устроили гонки на умных пылесосах. Ждём такое в олимпийской п

Формула-1, которую мы заслужили: коты устроили гонки на умных пылесосах.

Ждём такое в олимпийской программе

Мемы

0 комментариев

dvachannel 9 часов назад

Состояние

Кошаки

0 комментариев

cats_cats 9 часов назад

Мемы

0 комментариев

memachh 9 часов назад

К еве, младшей дочке и фикрату приехали анины родители

Крипта

0 комментариев

givemetonru 9 часов назад

Куда перейти из FaceBook

Люди все чаще уходят из фейсбука на DFace, где можно писать что хочешь.

DFace

Мемы

0 комментариев

BeanyBeliatig 1 недель

1.2k

Посмотрите и распространите, это сейчас важно

Юмор

0 комментариев

leoday 9 часов назад

Люблю сосать парню когда он разговаривает по телефону Когда парень разговаривает по телефону, то сн

Люблю сосать парню когда он разговаривает по телефону

Когда парень разговаривает по телефону, то снимаю с него трусы и начинаю ласкать и делать минет. Он в такие моменты такой смешной, сказать ничего не может, мямлит что-то в трубку, а я угораю с него)

Истории

0 комментариев

pozor_istorii 9 часов назад

В Госдуме предложили родителям мотивировать своих детей быстрее создавать семьи и заводить детей.

В Госдуме предложили родителям мотивировать своих детей быстрее создавать семьи и заводить детей.

По словам главы комитета по защите семьи Нины Останиной, такое воспитательное давление «можно и нужно» начинать уже с 18 лет.

topor 9 часов назад

tits_tweets 9 часов назад

😵‍💫В России появилось первое дело за просмотр экстремистских материалов В Каменске-Уральском состав

😵‍💫В России появилось первое дело за просмотр экстремистских материалов

В Каменске-Уральском составили первый в России протокол по статье 13.53 КоАП — «умышленный поиск экстремистских материалов». Молодому человеку 20 лет, штраф по этой статье — от 3 до 5 тысяч рублей. По словам юриста Сергея Барсукова, представляющего интересы обвиняемого, тот вину не признаёт и утверждает, что просто случайно открыл страницу с контентом, признанным экстремистским.

Судебное заседание 14 октября перенесли на 6 ноября, чтобы запросить дополнительные доказательства. Защита добилась возвращения протокола в полицию из-за недочётов. По словам Барсукова, сведения о действиях молодого человека в интернет передал оператор связи, но какой именно — неизвестно.

Закон о штрафах за поиск экстремистских материалов вступил в силу 1 сентября. Поправки критиковали даже сторонники регулирования — указывали, что доказать «умысел» почти невозможно. Минцифры ранее напоминало: за случайное открытие страницы наказание не предусмотрено.

ChatGPT

Нейросети

0 комментариев

gptpublic 9 часов назад

Еще посты

Свежие комментарии

jijik 1 недель

Можно название?

к записи →

Миннигуль 3 недель назад

Ох капец 😂😂😂😂 во папа дает

к записи →

menotebo 1 месяцев

Конечно, а ты думала

к записи →

Arina 1 месяцев

это Sonny Boy~

к записи →

Alex 1 месяцев

дружище, откуда ты взял это видео? меня интересует трек из него, но запись очень короткая - шазам не подхватывает =/

к записи →

Политика конфиденциальности | TwitReactor | VkVhod | DurovLoh