Memoria y contexto
Mantener coherentes las historias largas más allá de la ventana de contexto.
Resumen continuo
Con la memoria activada, el tramo más antiguo de un chat largo se pliega en un resumen continuo de la historia y los mensajes resumidos salen del prompt. La historia conserva su forma mientras el gasto de tokens se mantiene plano.
El resumen corre en segundo plano con modelos gratuitos rápidos; sigues chateando mientras se pliega. El resumen vigente viaja en un bloque de sistema.
Recuperación semántica
Junto al resumen, el chat reciente se vectoriza y se compara con mensajes antiguos y candidatos de lore; las mejores coincidencias se inyectan como contexto relevante. Los detalles viejos reaparecen justo cuando la escena los roza.
Búsqueda web
Opcional por conversación. Un clasificador pequeño decide primero si tu mensaje de verdad necesita datos frescos; solo entonces se ejecuta una búsqueda real y sus resultados entran al contexto.
El motor y el tamaño de contexto se configuran en el panel de ajustes. La búsqueda web está disponible en cuentas de pago.
Dónde están los interruptores
Memoria y búsqueda web son interruptores por conversación en el panel de ajustes; los presets aportan los valores por defecto. El ajuste de modelo utilitario elige qué modelo hace el plegado y el trabajo de fondo.