Memória e contexto
Mantendo histórias longas coerentes além da janela de contexto.
Resumo contínuo
Com a memória ligada, o trecho mais antigo de um chat longo é dobrado em um resumo contínuo da história e as mensagens resumidas saem do prompt. A história mantém a forma enquanto o gasto de tokens fica estável.
O resumo roda em segundo plano em modelos gratuitos rápidos; você continua conversando enquanto ele dobra. O resumo vigente viaja em um bloco de sistema.
Recuperação semântica
Ao lado do resumo, o chat recente é vetorizado e comparado com mensagens antigas e candidatos de lore; as melhores correspondências são injetadas como contexto relevante. Detalhes antigos ressurgem exatamente quando a cena os toca.
Busca na web
Opcional por conversa. Um classificador pequeno decide primeiro se sua mensagem realmente precisa de fatos frescos; só então uma busca de verdade roda e seus resultados entram no contexto.
Motor e tamanho de contexto são configuráveis no painel de configurações. A busca na web está disponível em contas pagas.
Onde ficam as chaves
Memória e busca na web são chaves por conversa no painel de configurações; presets trazem os padrões para chats novos. A configuração de modelo utilitário escolhe qual modelo faz a dobra e o trabalho de fundo.