Опубликовано
Продукт

Мы объединили 100+ бесплатных AI-моделей в один эндпоинт

За два дня мы подключили к UnoRouter 15 бесплатных провайдеров: 134 строки бесплатных моделей, один OpenAI-compatible эндпоинт, $0 за токен. Они бесплатны не просто так и несут лимиты по запросам, которые мы не можем поднять. Вот честная версия.

·3 мин чтения·Автор: команда UnoRouter
анонспродукт

Мир бесплатных LLM реален, но разрознен: Groq, Gemini, Cloudflare, Mistral, OVHcloud и десяток других раздают настоящие мощности, но каждый прячет их за своей страницей регистрации, своим форматом ключа и своим несовместимым API. За два дня мы нашли, протестировали и объединили в UnoRouter всех легитимных провайдеров с постоянным бесплатным доступом, до которых смогли дотянуться. Результат: 134 строки бесплатных моделей от 15 провайдеров за одним OpenAI-compatible эндпоинтом и одним ключом.

Что мы добавили

Пятнадцать бесплатных провайдеров, один за другим: Groq, Gemini, Cerebras, SambaNova, Mistral, Cloudflare Workers AI (два аккаунта), GitHub Models, Z.ai, OVHcloud, AI Horde, Pollinations, Cohere, Jina, NVIDIA NIM и OpenRouter. Это 134 строки бесплатных моделей: Llama, gpt-oss, Qwen, Mistral, GLM, Nemotron и другие, плюс 30 бесплатных моделей эмбеддингов и 13 бесплатных моделей для изображений и аудио. Каждая проходит сквозную проверку на HTTP, стриминг и вызовы инструментов перед запуском в работу, те же проверки на подлинность и совместимость, что мы прогоняем на платных моделях.

Бесплатны не просто так

Эти модели действительно бесплатны, и именно поэтому у них есть лимиты. Эти лимиты задает провайдер, а не мы, и мы не можем их поднять. Каждый источник навязывает свои ограничения: запросы в минуту, дневные квоты на токены, бюджеты нейронов Cloudflare, приоритет в волонтерской очереди. Уперлись в лимит, и провайдер возвращает 429, пока тот не сбросится. Бесплатный ключ, который работал утром, к обеду может быть исчерпан. Бесплатный тариф это пропускная способность по принципу best-effort, а не гарантия. Если вашей нагрузке нужна предсказуемая задержка и никаких внезапных 429, используйте платную модель.

Зачем вообще их объединять

Потому что альтернатива это пятнадцать аккаунтов. У каждого провайдера своя регистрация, свой формат ключа, свой базовый URL и свои причуды: Z.ai говорит на пути Zhipu V4, Cloudflare несет id аккаунта в URL, AI Horde хочет анонимный ключ, GitHub прячет модели за областью видимости токена. Мы взяли все это на себя, чтобы вы обращались к ним так же, как ко всему остальному: один OpenAI-compatible эндпоинт, один ключ, имя модели. Честное правило, которому мы себя держим: один реальный аккаунт на провайдера, лимиты приняты, ничего не нафармлено, ничего не объединено в пул. Мы отдаем бесплатный тариф как подарок, а не как перепродажу чужой квоты.

Как мы смягчаем лимиты

Многие из этих моделей предоставляются более чем одним бесплатным провайдером. Одна только Llama 3.3 70B работает у семи из них. Когда одну и ту же модель предлагают несколько провайдеров, мы сворачиваем их в одно публикуемое имя и переключаемся автоматически: если один источник возвращает 429 или замолкает, запрос берет на себя следующий рабочий провайдер, обслуживающий эту модель. Это единственный рычаг, который мы действительно контролируем. Он не поднимает лимит ни одного отдельного провайдера, но означает, что бесплатная модель с несколькими источниками продолжает отвечать еще долго после того, как любой из ее провайдеров исчерпан. У бесплатных моделей с одним источником нет запасного варианта, поэтому они застревают, когда их единственный источник израсходован.

Чего мы не делали

Мы не добавляли реверс-прокси, которые без разрешения перепродают флагманы OpenAI или Claude. Мы не подтягивали агрегаторы личных ключей, чьи токены непередаваемы, и сервисы пулов из пулов, которые фармят и ротируют чужие ключи. Они существуют, они соблазнительны, и это ровно та серая каша, которую этот шлюз и призван заменить. Каждый провайдер в списке раздает свой бесплатный тариф намеренно, на своих условиях. Если источник не смог пройти эту планку, его здесь нет.

Попробуйте

Все 134 бесплатные модели доступны за одним OpenAI-compatible эндпоинтом. Получите API-ключ или посмотрите каталог моделей и отфильтруйте бесплатные. Просто помните, на каком тарифе вы находитесь, когда появляется 429.

Похожие посты