Chat-Handbuch

Gedächtnis & Kontext

Lange Geschichten über das Kontextfenster hinaus kohärent halten.

Fortlaufende Zusammenfassung

Mit aktiviertem Gedächtnis wird der älteste Abschnitt eines langen Chats in eine fortlaufende Story-Zusammenfassung gefaltet, und die zusammengefassten Nachrichten fallen aus dem Prompt. Die Geschichte behält ihre Form, während der Tokenverbrauch flach bleibt.

Die Zusammenfassung läuft im Hintergrund auf schnellen kostenlosen Modellen; du chattest weiter, während gefaltet wird. Die aktuelle Zusammenfassung reist als Systemblock mit.

Semantischer Abruf

Neben der Zusammenfassung wird der jüngste Chat eingebettet und mit älteren Nachrichten und Lore-Kandidaten verglichen; die besten Treffer werden als relevanter Hintergrund injiziert. Alte Details tauchen genau dann wieder auf, wenn die Szene sie berührt.

Websuche

Opt-in pro Gespräch. Ein kleiner Klassifikator entscheidet zuerst, ob deine Nachricht wirklich frische Fakten braucht; erst dann läuft eine echte Suche und ihre Ergebnisse fließen in den Kontext.

Suchmaschine und Kontextgröße sind im Einstellungs-Drawer konfigurierbar. Die Websuche steht bezahlten Konten zur Verfügung.

Wo die Schalter liegen

Gedächtnis und Websuche sind Schalter pro Gespräch im Einstellungs-Drawer; Presets tragen Standards für neue Chats. Die Einstellung Utility-Modell bestimmt, welches Modell das Falten und die Hintergrundarbeit übernimmt.