Szukaj w dokumentacji...

Zacznij wpisywać, aby przeszukać dokumentację

Przewodnik po czacie

Pamięć i kontekst

Spójność długich historii poza oknem kontekstu.

Kroczące streszczenie

Z włączoną pamięcią najstarszy fragment długiego czatu jest zwijany w kroczące streszczenie historii, a streszczone wiadomości znikają z promptu. Historia trzyma kształt, a zużycie tokenów pozostaje płaskie.

Streszczanie działa w tle na szybkich darmowych modelach; rozmawiasz dalej, gdy się zwija. Bieżące streszczenie jedzie w bloku systemowym.

Przywoływanie semantyczne

Obok streszczenia świeży czat jest osadzany i porównywany ze starszymi wiadomościami oraz kandydatami lore; najlepsze dopasowania są wstrzykiwane jako istotne tło. Stare szczegóły wynurzają się dokładnie wtedy, gdy scena je muska.

Opt-in per rozmowa. Mały klasyfikator najpierw decyduje, czy twoja wiadomość naprawdę potrzebuje świeżych faktów; dopiero wtedy rusza prawdziwe wyszukiwanie, a wyniki dołączają do kontekstu.

Silnik i rozmiar kontekstu konfigurujesz w panelu ustawień. Wyszukiwanie w sieci jest dostępne na kontach płatnych.

Gdzie są przełączniki

Pamięć i wyszukiwanie to przełączniki per rozmowa w panelu ustawień; presety niosą domyślne dla nowych czatów. Ustawienie modelu pomocniczego wybiera, który model zwija i robi pracę w tle.

Pamięć, wyszukiwanie i sieć w UnoRouter