Plattform-Leitfaden

Modelle & Preise

Was das Suffix :free bedeutet, wie die Nutzung abgerechnet wird und warum ein Modell manchmal verschwindet.

Der Katalog

Die Modelle-Seite listet jedes Modell mit Kontextfenster, Preisen pro Token, unterstützten Endpunkten und Fähigkeitsfiltern wie Tool-Aufrufen und Bildeingabe auf. Jedes Modell hat seine eigene Seite mit Copy-and-paste-Codebeispielen. Nicht jedes kostenlose Modell unterstützt Tool-Aufrufe oder Vision, prüfe also die Fähigkeits-Badges, bevor du eines in einen Coding-Agenten einbindest.

Die Rankings zeigen, welche kostenlosen Modelle tatsächlich liefern, basierend auf Community-Testergebnissen. Status verfolgt die Live-Verfügbarkeit der Anbieter.

Kostenlose vs. kostenpflichtige Modelle

Kostenlose Modelle tragen ein Suffix :free, zum Beispiel gpt-oss-120b:free

Ein :free-Modell wird nur an kostenlose Upstream-Anbieter geleitet und berührt niemals dein Guthaben. Derselbe Basisname ohne Suffix ist die kostenpflichtige Version: stabil, ohne Obergrenze und pro Token abgerechnet. Beide können nebeneinander existieren, sodass der Wechsel von kostenlos zu kostenpflichtig eine Änderung an einer einzigen Zeichenkette ist.

Kostenlose Modelle sind aus gutem Grund kostenlos: die Upstream-Anbieter legen die Ratenlimits fest, nicht wir. Erwarte 429-Antworten zu Stoßzeiten und nutze ein kostenpflichtiges Modell, wenn du Zuverlässigkeit brauchst.

So funktioniert die Preisgestaltung

Die meisten Modelle rechnen pro Token ab, mit getrennten Preisen für Eingabe und Ausgabe. Einige wenige Modelle (meist Bild und Video) rechnen stattdessen einen Pauschalpreis pro Aufruf ab. Was du auf der Modellseite siehst, ist das, was du bezahlst: keine Abonnements, keine versteckten Gebühren, dein Guthaben verringert sich einfach pro Anfrage.

Die Preise-Seite enthält die aktuellen Aufladeoptionen; jede Modellseite zeigt Live-Preise pro Token.

Prompt-Caching

Bei Modellen, die Prompt-Caching unterstützen (Claude und andere), werden wiederholte Prompt-Präfixe zu einem reduzierten Tarif für zwischengespeicherte Eingaben abgerechnet, während das Schreiben eines neuen Cache-Eintrags etwas mehr als ein normales Eingabe-Token kostet (etwa 1,25x).

Das Caching erfolgt automatisch. Arbeitslasten mit langen, stabilen System-Prompts (Agenten, RP-Presets) profitieren am meisten, ganz ohne Konfiguration.

Verfügbarkeit & Failover

Wenn ein kostenloses Modell mehrere Upstream-Anbieter hat, wechseln Anfragen automatisch zum nächsten, sobald ein Anbieter sein Ratenlimit erreicht. Modelle mit nur einem Anbieter können nicht wechseln, sie stocken also, bis das Limit zurückgesetzt wird.

Jedes Modell läuft über einen oder mehrere Anbieterkanäle. Ein Kanal, der sein Ratenlimit erreicht, wird vorübergehend deaktiviert und ausgeblendet, er wird während seiner Erholung nicht als Option angezeigt. Solange noch ein Kanal verfügbar ist, funktioniert das Modell weiterhin über diesen. Erst wenn jeder Kanal eines Modells ratenlimitiert ist, verschwindet das Modell selbst aus dem Katalog.

Dass ein Modell aus der Liste verschwindet, ist unter Last zu erwarten, kein Tippfehler und kein Ausfall. Es erscheint von selbst wieder, sobald ein Kanal eine Zustandsprüfung besteht, meist innerhalb von Minuten. Wenn sich ein gespeicherter Modellname nicht mehr auflösen lässt, prüfe die Modelle-Seite: Entweder erholt sich das Modell gerade oder es wurde umbenannt.