Память и контекст
Длинные истории остаются связными за пределами контекстного окна.
Скользящая сводка
С включённой памятью самый старый кусок длинного чата сворачивается в бегущую сводку сюжета, а сведённые сообщения вырезаются из промпта. История сохраняет форму, расход токенов остаётся ровным.
Сведение идёт в фоне на быстрых бесплатных моделях; вы продолжаете общаться, пока оно сворачивает. Текущая сводка едет в системном блоке.
Семантическое извлечение
Рядом со сводкой свежий чат эмбеддится и сравнивается со старыми сообщениями и кандидатами лора; ближайшие совпадения вставляются как уместный фон. Старые детали всплывают ровно тогда, когда сцена их касается.
Веб-поиск
Включается на разговор. Маленький классификатор сперва решает, действительно ли сообщению нужны свежие факты; лишь тогда запускается настоящий поиск, и его результаты входят в контекст.
Поисковик и размер контекста настраиваются в панели настроек. Веб-поиск доступен на платных аккаунтах.
Где переключатели
Память и веб-поиск — переключатели на разговор в панели настроек; пресеты несут значения по умолчанию для новых чатов. Настройка служебной модели выбирает, какая модель сворачивает и делает фоновую работу.