Gedächtnis & Kontext
Lange Geschichten über das Kontextfenster hinaus kohärent halten.
Fortlaufende Zusammenfassung
Mit aktiviertem Gedächtnis wird der älteste Abschnitt eines langen Chats in eine fortlaufende Story-Zusammenfassung gefaltet, und die zusammengefassten Nachrichten fallen aus dem Prompt. Die Geschichte behält ihre Form, während der Tokenverbrauch flach bleibt.
Die Zusammenfassung läuft im Hintergrund auf schnellen kostenlosen Modellen; du chattest weiter, während gefaltet wird. Die aktuelle Zusammenfassung reist als Systemblock mit.
Semantischer Abruf
Neben der Zusammenfassung wird der jüngste Chat eingebettet und mit älteren Nachrichten und Lore-Kandidaten verglichen; die besten Treffer werden als relevanter Hintergrund injiziert. Alte Details tauchen genau dann wieder auf, wenn die Szene sie berührt.
Websuche
Opt-in pro Gespräch. Ein kleiner Klassifikator entscheidet zuerst, ob deine Nachricht wirklich frische Fakten braucht; erst dann läuft eine echte Suche und ihre Ergebnisse fließen in den Kontext.
Suchmaschine und Kontextgröße sind im Einstellungs-Drawer konfigurierbar. Die Websuche steht bezahlten Konten zur Verfügung.
Wo die Schalter liegen
Gedächtnis und Websuche sind Schalter pro Gespräch im Einstellungs-Drawer; Presets tragen Standards für neue Chats. Die Einstellung Utility-Modell bestimmt, welches Modell das Falten und die Hintergrundarbeit übernimmt.