Mémoire & contexte
Garder les longues histoires cohérentes au-delà de la fenêtre de contexte.
Résumé continu
Avec la mémoire activée, la tranche la plus ancienne d'un long chat est repliée dans un résumé continu de l'histoire, et les messages résumés quittent le prompt. L'histoire garde sa forme pendant que la consommation de tokens reste stable.
Le résumé tourne en arrière-plan sur des modèles gratuits rapides ; vous continuez à discuter pendant le repli. Le résumé courant accompagne la requête dans un bloc système.
Récupération sémantique
En parallèle du résumé, le chat récent est vectorisé et comparé aux messages plus anciens et aux candidats de lore ; les meilleures correspondances sont injectées comme contexte pertinent. Les vieux détails resurgissent pile quand la scène les effleure.
Recherche web
Opt-in par conversation. Un petit classifieur décide d'abord si votre message a vraiment besoin de faits frais ; alors seulement une vraie recherche s'exécute et ses résultats rejoignent le contexte.
Moteur et taille de contexte se règlent dans le panneau de paramètres. La recherche web est réservée aux comptes payants.
Où sont les interrupteurs
Mémoire et recherche web sont des interrupteurs par conversation dans le panneau de paramètres ; les presets fournissent les défauts des nouveaux chats. Le réglage du modèle utilitaire choisit quel modèle fait le repli et le travail d'arrière-plan.