Plattform-Leitfaden

Fehler & Ratenlimits

Was jeder Statuscode bedeutet und was du dagegen tun kannst.

Das Fehlerformat

Fehler kommen als JSON im OpenAI-Fehlerformat zurück. Die Nachricht gibt an, was passiert ist, code ist ein stabiler, maschinenlesbarer Bezeichner, und jeder Nachricht wird eine Request-ID angehängt:

json

{
  "error": {
    "message": "Model \"gpt-5.5-typo\" is not offered here. Check the model name for typos, or switch to a model from our supported list. (request id: 20260705...)",
    "type": "new_api_error",
    "code": "model_not_found"
  }
}

Gib immer die Request-ID an, wenn du den Support kontaktierst oder ein Discord-Ticket öffnest. Damit können wir deine genaue Anfrage in den Logs finden.

Statuscodes auf einen Blick

Die Statuscodes, denen du tatsächlich begegnen wirst:

Code	Bedeutung	Was zu tun ist
`400`	Ungültige Anfrage: fehlerhafte Parameterwerte (zum Beispiel max_tokens unter dem Modellminimum) oder ein durch die Inhaltsmoderation blockierter Prompt.	Behebe die Anfrage. Ein unveränderter erneuter Versuch schlägt wieder fehl.
`401`	Schlüsselproblem: fehlender, ungültiger, abgelaufener oder deaktivierter API-Schlüssel.	Prüfe den Authorization-Header und deinen Schlüssel auf der Tokens-Seite.
`402`	Das eigene Ausgabenlimit dieses Schlüssels ist erschöpft.	Erhöhe das Limit des Schlüssels oder erstelle einen neuen Schlüssel.
`403`	Zugriff verweigert: Kontoguthaben leer, Modell für diesen Schlüssel nicht erlaubt oder deine IP steht nicht auf der Zulassungsliste des Schlüssels.	Lade auf oder prüfe die Modell- und IP-Einschränkungen des Schlüssels.
`413`	Anfrage zu groß für die Obergrenze der kostenlosen Testphase dieses Modells.	Kürze den Prompt oder wechsle zum kostenpflichtigen Modell.
`429`	Ein Ratenlimit wurde ausgelöst (siehe die Arten unten).	Warte die Retry-After-Sekunden ab, versuche es dann erneut oder wechsle das Modell.
`500`	Auf unserer Seite oder beim Upstream-Anbieter ist etwas fehlgeschlagen.	Versuche es nach kurzer Wartezeit erneut; anhaltende 500er sind eine Meldung wert.
`503`	Alle Anbieter für das Modell sind ausgelastet, oder der Modellname existiert nicht.	Lies die Nachricht: Auslastung löst sich in Minuten, ein Tippfehler nicht.

503: ausgelastet vs. unbekanntes Modell

Zwei sehr unterschiedliche Situationen teilen sich den Status 503. Die erste ist eine vorübergehende Überlastung:

text

HTTP/1.1 503 Service Unavailable

{
  "error": {
    "message": "All providers for model \"kimi-k2.6:free\" are busy right now (they hit their rate limit). This is not a spelling error. Please try again in a little while, or switch to another model. (request id: 20260705...)",
    "type": "new_api_error",
    "code": "get_channel_failed"
  }
}

Der Code get_channel_failed (alle Anbieter ausgelastet) bedeutet, dass jeder kostenlose Anbieter für dieses Modell momentan ratenlimitiert ist. Das erholt sich innerhalb von Minuten automatisch: erneut versuchen oder Modell wechseln. Der Code model_not_found (hier nicht angeboten) bedeutet, dass der Modellname selbst sich nicht auflösen lässt, und ein erneuter Versuch wird niemals helfen. Prüfe auf Tippfehler oder schlage den aktuellen Namen im Katalog nach.

Behandle 503 mit get_channel_failed als Wiederholung/Fallback und 503 mit model_not_found als harten Fehler in deinem Client.

Die Arten von Ratenlimits

Ein 429 kann aus mehreren Schichten stammen:

Unsere Obergrenze für kostenlose Modelle: 1 Anfrage pro Minute pro kostenlosem Modell pro Nutzer. Eine Fairness-Obergrenze, damit geteilte Pools die Stoßzeiten überstehen.
Limits des Upstream-Anbieters: der Anbieter hinter einem kostenlosen Modell hat sein eigenes Limit erreicht ("temporarily rate-limited upstream", also vorübergehend upstream ratenlimitiert).
Tägliche Token-Budgets bei einigen kostenlosen Pools; diese werden um Mitternacht UTC zurückgesetzt.
Token-pro-Minute-Obergrenzen, die bei sehr großen Prompts auslösen.
Ein Nebenläufigkeitslimit pro Nutzer, wenn zu viele Anfragen parallel laufen.

Kostenpflichtige Modelle haben keine von UnoRouter auferlegten Ratenlimits.

Das Limit für kostenlose Modelle im Detail

Wenn unsere Obergrenze von 1 pro Minute auslöst, erhältst du standardmäßige Ratenlimit-Header, sodass Clients präzise zurückweichen können:

text

HTTP/1.1 429 Too Many Requests
Retry-After: 38
X-RateLimit-Limit: 1
X-RateLimit-Remaining: 0
X-RateLimit-Reset: 1783198478

Retry-After ist dynamisch: die tatsächlich verbleibenden Sekunden in deinem Fenster, nicht pauschal 60. Die Fehlermeldung nennt auch den kostenpflichtigen Zwilling des Modells, der kein Limit hat.

Größenobergrenzen der Testphase

Einige normalerweise kostenpflichtige Modelle werden kostenlos mit einer Obergrenze für die Anfragegröße angeboten. Zu große Prompts erhalten 413 mit einer Nachricht wie: Request body too large for gpt-4.1 model. Max size: 8000 tokens.

Die Obergrenze gilt nur für die kostenlose Testroute; das kostenpflichtige Modell nimmt Prompts in voller Länge an.

Hinweise zu Wiederholungen

Beachte Retry-After bei 429. Versuche 503 get_channel_failed nach kurzer Wartezeit erneut oder weiche auf ein anderes Modell aus. Wiederhole keine Fehler der 400er-Klasse, sie sind deterministisch.

Fehlgeschlagene und abgelehnte Anfragen werden nicht abgerechnet: jede Vorabreservierung auf deinem Guthaben wird erstattet, wenn die Anfrage fehlschlägt.