Wir haben 100+ kostenlose KI-Modelle in einem einzigen Endpunkt gebündelt
In zwei Tagen haben wir 15 kostenlose Anbieter in UnoRouter eingebunden: 134 kostenlose Modell-Eintraege, ein OpenAI-compatible Endpunkt, $0 pro Token. Sie sind nicht ohne Grund kostenlos und bringen Rate-Limits mit, die wir nicht anheben koennen. Hier ist die ehrliche Version.
Die Landschaft kostenloser LLMs ist real, aber zersplittert: Groq, Gemini, Cloudflare, Mistral, OVHcloud und ein Dutzend weitere verschenken jeweils echte Kapazitaet, versteckt hinter einem Dutzend Anmeldeseiten, einem Dutzend Schluesselformaten und einem Dutzend inkompatibler APIs. In zwei Tagen haben wir jeden legitimen, dauerhaft kostenlosen Anbieter entdeckt, getestet und in UnoRouter zusammengefuehrt, den wir finden konnten. Das Ergebnis: 134 kostenlose Modell-Eintraege von 15 Anbietern hinter einem OpenAI-compatible Endpunkt und einem einzigen Schluessel.
Was wir hinzugefuegt haben
Fuenfzehn kostenlose Anbieter, einer nach dem anderen: Groq, Gemini, Cerebras, SambaNova, Mistral, Cloudflare Workers AI (zwei Konten), GitHub Models, Z.ai, OVHcloud, AI Horde, Pollinations, Cohere, Jina, NVIDIA NIM und OpenRouter. Das sind 134 kostenlose Modell-Eintraege: Llama, gpt-oss, Qwen, Mistral, GLM, Nemotron und mehr, dazu 30 kostenlose Embedding-Modelle und 13 kostenlose Bild- und Audio-Modelle. Jedes einzelne wird durchgaengig auf HTTP, Streaming und Tool-Calls geprueft, bevor es live geht, dieselben Echtheits- und Harness-Pruefungen, die wir auch bei kostenpflichtigen Modellen durchfuehren.
Nicht ohne Grund kostenlos
Diese Modelle sind wirklich kostenlos, und genau deshalb haben sie Grenzen. Der Anbieter legt diese Grenzen fest, nicht wir, und wir koennen sie nicht anheben. Jeder Upstream erzwingt seine eigenen Rate-Limits: Anfragen pro Minute, taegliche Token-Kontingente, Cloudflare-Neuron-Budgets, Prioritaet in der Freiwilligen-Warteschlange. Wer ein Limit erreicht, bekommt von diesem Anbieter ein 429, bis es zuruckgesetzt wird. Ein kostenloser Schluessel, der heute Morgen noch funktionierte, kann am Nachmittag schon erschoepft sein. Der kostenlose Tarif bietet Best-Effort-Durchsatz, keine Garantie. Wenn Ihr Workload vorhersehbare Latenz und keine ueberraschenden 429er braucht, nutzen Sie ein kostenpflichtiges Modell.
Warum sie ueberhaupt buendeln
Weil die Alternative fuenfzehn Konten waeren. Jeder Anbieter hat seine eigene Anmeldung, sein eigenes Schluesselformat, seine eigene Basis-URL und seine eigenen Eigenheiten: Z.ai spricht den Zhipu V4-Pfad, Cloudflare fuehrt die Konto-ID in der URL, AI Horde verlangt einen anonymen Schluessel, GitHub sperrt Modelle hinter einem Token-Scope. Wir haben all das abgefangen, sodass Sie sie genauso aufrufen wie alles andere: ein OpenAI-compatible Endpunkt, ein Schluessel, ein Modellname. Die ehrliche Regel, an die wir uns halten: ein echtes Konto pro Anbieter, Limits akzeptiert, nichts gefarmt, nichts gepoolt. Wir stellen den kostenlosen Tarif als Geschenk bereit, nicht als Weiterverkauf des Kontingents anderer.
Wie wir die Grenzen abfedern
Viele dieser Modelle werden von mehr als einem kostenlosen Anbieter bereitgestellt. Allein Llama 3.3 70B laeuft bei sieben von ihnen. Wenn mehrere Anbieter dasselbe Modell anbieten, fassen wir sie unter einem veroeffentlichten Namen zusammen und schalten automatisch um: Wenn ein Upstream ein 429 zuruckgibt oder verstummt, uebernimmt der naechste gesunde Anbieter, der dieses Modell bereitstellt, die Anfrage. Das ist der eine Hebel, den wir tatsaechlich steuern. Er hebt kein Limit eines einzelnen Anbieters an, aber er sorgt dafuer, dass ein Modell mit mehreren Quellen noch lange weiter antwortet, nachdem einer seiner Anbieter erschoepft ist. Modelle mit nur einer Quelle haben kein Fallback und bleiben daher stehen, sobald ihr einziger Upstream aufgebraucht ist.
Was wir nicht getan haben
Wir haben keine Reverse-Proxys hinzugefuegt, die OpenAI- oder Claude-Flaggschiffe ohne Erlaubnis weiterverkaufen. Wir haben keine Aggregatoren persoenlicher Schluessel eingebunden, deren Token nicht uebertragbar sind, und keine Pool-of-Pools-Dienste, die fremde Schluessel farmen und rotieren. Die gibt es, sie sind verlockend, und sie sind genau das Graumarkt-Chaos, das dieses Gateway ersetzen soll. Jeder Anbieter auf der Liste verschenkt seinen kostenlosen Tarif bewusst, zu seinen eigenen Bedingungen. Wenn eine Quelle diese Huerde nicht nehmen konnte, ist sie hier nicht dabei.
Probieren Sie es aus
Alle 134 kostenlosen Modelle sind hinter einem OpenAI-compatible Endpunkt verfuegbar. Holen Sie sich einen API-Schluessel oder durchstoebern Sie den Modellkatalog und filtern Sie nach kostenlos. Denken Sie nur daran, in welchem Tarif Sie sich befinden, wenn ein 429 auftaucht.
UnoRouter ist in den KI-Tool- und Startup-Verzeichnissen gelistet. Hier finden Sie uns, pruefen die Eintraege und lesen unabhaengige Einschaetzungen.
UnoRouter und OpenRouter stellen beide viele Modelle hinter einen OpenAI-kompatiblen Schlüssel. Der Unterschied liegt darin, was darüber liegt: eine reine API oder eine API plus integrierten Chat- und Charakter-Client. Hier die ehrliche Version.
Verknüpf dein Konto für 1 $, boost den Server für 1 $ pro Monat, jag Bugs für bis zu 50 $. Wir haben gerade den UnoRouter Discord eröffnet.