Memoria e contesto
Tenere coerenti le storie lunghe oltre la finestra di contesto.
Riassunto continuo
Con la memoria attiva, il tratto più vecchio di una chat lunga viene ripiegato in un riassunto continuo della storia e i messaggi riassunti escono dal prompt. La storia mantiene la sua forma mentre il consumo di token resta piatto.
Il riassunto gira in sottofondo su modelli gratuiti rapidi; continui a chattare mentre ripiega. Il riassunto corrente viaggia in un blocco di sistema.
Recupero semantico
Accanto al riassunto, la chat recente viene vettorizzata e confrontata con messaggi più vecchi e candidati di lore; le corrispondenze migliori vengono iniettate come contesto pertinente. I vecchi dettagli riaffiorano proprio quando la scena li sfiora.
Ricerca web
Attivabile per conversazione. Un piccolo classificatore decide prima se il tuo messaggio ha davvero bisogno di fatti freschi; solo allora parte una ricerca vera e i suoi risultati entrano nel contesto.
Motore e dimensione del contesto si configurano nel pannello impostazioni. La ricerca web è disponibile per gli account a pagamento.
Dove stanno gli interruttori
Memoria e ricerca web sono interruttori per conversazione nel pannello impostazioni; i preset portano i valori predefiniti per le nuove chat. L'impostazione modello di utilità sceglie quale modello esegue il ripiegamento e il lavoro in sottofondo.