Guia do chat

Memória e contexto

Mantendo histórias longas coerentes além da janela de contexto.

Resumo contínuo

Com a memória ligada, o trecho mais antigo de um chat longo é dobrado em um resumo contínuo da história e as mensagens resumidas saem do prompt. A história mantém a forma enquanto o gasto de tokens fica estável.

O resumo roda em segundo plano em modelos gratuitos rápidos; você continua conversando enquanto ele dobra. O resumo vigente viaja em um bloco de sistema.

Recuperação semântica

Ao lado do resumo, o chat recente é vetorizado e comparado com mensagens antigas e candidatos de lore; as melhores correspondências são injetadas como contexto relevante. Detalhes antigos ressurgem exatamente quando a cena os toca.

Busca na web

Opcional por conversa. Um classificador pequeno decide primeiro se sua mensagem realmente precisa de fatos frescos; só então uma busca de verdade roda e seus resultados entram no contexto.

Motor e tamanho de contexto são configuráveis no painel de configurações. A busca na web está disponível em contas pagas.

Onde ficam as chaves

Memória e busca na web são chaves por conversa no painel de configurações; presets trazem os padrões para chats novos. A configuração de modelo utilitário escolhe qual modelo faz a dobra e o trabalho de fundo.