Chúng tôi gom hơn 100 mô hình AI miễn phí vào một endpoint duy nhất
Trong hai ngày, chúng tôi đã kết nối 15 nhà cung cấp miễn phí vào UnoRouter: 134 dòng mô hình miễn phí, một endpoint OpenAI-compatible, $0 cho mỗi token. Chúng miễn phí là có lý do và đi kèm giới hạn tần suất mà chúng tôi không thể nâng lên. Đây là phiên bản thành thật.
Thế giới LLM miễn phí là có thật nhưng manh mún: Groq, Gemini, Cloudflare, Mistral, OVHcloud và cả tá cái tên khác, mỗi bên đều cho đi năng lực thật sự, nhưng nằm sau cả tá trang đăng ký, cả tá định dạng key và cả tá API không tương thích với nhau. Trong hai ngày, chúng tôi đã tìm hiểu, kiểm thử và gộp mọi nhà cung cấp miễn phí vĩnh viễn hợp pháp mà chúng tôi tìm được vào UnoRouter. Kết quả: 134 dòng mô hình miễn phí từ 15 nhà cung cấp, đứng sau một endpoint OpenAI-compatible và một key duy nhất.
Những gì chúng tôi đã thêm
Mười lăm nhà cung cấp miễn phí, lần lượt từng cái một: Groq, Gemini, Cerebras, SambaNova, Mistral, Cloudflare Workers AI (hai tài khoản), GitHub Models, Z.ai, OVHcloud, AI Horde, Pollinations, Cohere, Jina, NVIDIA NIM và OpenRouter. Tổng cộng 134 dòng mô hình miễn phí: Llama, gpt-oss, Qwen, Mistral, GLM, Nemotron và nhiều hơn nữa, cộng thêm 30 mô hình embedding miễn phí và 13 mô hình hình ảnh và âm thanh miễn phí. Mỗi mô hình đều được kiểm tra từ đầu đến cuối về HTTP, streaming và tool call trước khi lên sóng, đúng những bài kiểm tra tính xác thực và bộ khung mà chúng tôi chạy cho các mô hình trả phí.
Miễn phí là có lý do
Những mô hình này miễn phí thực sự, và đó chính là lý do chúng có giới hạn. Nhà cung cấp đặt ra những giới hạn đó, không phải chúng tôi, và chúng tôi không thể nâng lên. Mỗi nguồn thượng nguồn áp đặt giới hạn tần suất riêng: số request mỗi phút, hạn ngạch token mỗi ngày, ngân sách neuron của Cloudflare, mức ưu tiên trong hàng đợi tình nguyện. Chạm trần là nhà cung cấp đó trả về 429 cho tới khi reset. Một key miễn phí còn chạy được sáng nay có thể cạn kiệt vào chiều nay. Gói miễn phí là thông lượng theo kiểu cố hết sức, không phải một sự bảo đảm. Nếu khối lượng công việc của bạn cần độ trễ ổn định và không có những cú 429 bất ngờ, hãy dùng mô hình trả phí.
Tại sao phải gom chúng lại làm gì
Vì lựa chọn còn lại là mười lăm tài khoản. Mỗi nhà cung cấp có trang đăng ký riêng, định dạng key riêng, base URL riêng và những điểm oái oăm riêng: Z.ai nói theo đường dẫn Zhipu V4, Cloudflare mang account id trong URL, AI Horde muốn một key ẩn danh, GitHub khóa các mô hình sau phạm vi của token. Chúng tôi gánh hết tất cả những thứ đó để bạn gọi chúng theo đúng cách bạn gọi mọi thứ khác: một endpoint OpenAI-compatible, một key, một tên mô hình. Nguyên tắc thành thật mà chúng tôi tự ràng buộc: một tài khoản thật cho mỗi nhà cung cấp, chấp nhận giới hạn, không gom gặt, không gộp chung. Chúng tôi mở ra gói miễn phí như một món quà, không phải bán lại hạn ngạch của người khác.
Cách chúng tôi làm dịu các giới hạn
Nhiều mô hình trong số này được phục vụ bởi hơn một nhà cung cấp miễn phí. Riêng Llama 3.3 70B đã chạy trên bảy nhà cung cấp. Khi nhiều nhà cung cấp cùng cung cấp một mô hình, chúng tôi gộp chúng thành một tên công bố duy nhất và tự động chuyển dự phòng: nếu một nguồn thượng nguồn trả về 429 hoặc im lặng, nhà cung cấp khỏe mạnh kế tiếp đang phục vụ mô hình đó sẽ nhận request. Đó là cái đòn bẩy duy nhất mà chúng tôi thực sự kiểm soát được. Nó không nâng trần của bất kỳ nhà cung cấp đơn lẻ nào, nhưng nó có nghĩa là một mô hình miễn phí đa nguồn vẫn tiếp tục trả lời rất lâu sau khi bất kỳ nhà cung cấp nào của nó cạn kiệt. Các mô hình miễn phí đơn nguồn không có dự phòng, nên chúng đứng khựng khi nguồn thượng nguồn duy nhất của chúng cạn sạch.
Những gì chúng tôi đã không làm
Chúng tôi không thêm reverse proxy phục vụ lại các mô hình hàng đầu của OpenAI hay Claude mà không có phép. Chúng tôi không kéo vào các dịch vụ gom key cá nhân với token không thể chuyển nhượng, hay những dịch vụ pool-of-pools chuyên gom gặt và xoay vòng key của người khác. Chúng tồn tại, chúng đầy cám dỗ, và chúng chính là mớ chợ đen lộn xộn mà gateway này sinh ra để thay thế. Mỗi nhà cung cấp trong danh sách đều cho đi gói miễn phí của mình một cách có chủ đích, theo điều khoản riêng của họ. Nếu một nguồn không vượt qua được ngưỡng đó, nó không có mặt ở đây.
Dùng thử
Toàn bộ 134 mô hình miễn phí đang chạy sau một endpoint OpenAI-compatible. Lấy ngay một API key hoặc duyệt danh mục mô hình rồi lọc theo miễn phí. Chỉ cần nhớ bạn đang ở gói nào khi một cú 429 xuất hiện.
UnoRouter duoc liet ke trong cac thu muc cong cu AI va startup. Tai day ban co the tim thay chung toi, xac minh cac muc liet ke va doc danh gia doc lap.
UnoRouter và OpenRouter đều đặt nhiều mô hình sau một khóa tương thích OpenAI. Khác biệt nằm ở phần bên trên: một API không giao diện, hay một API cộng với máy khách trò chuyện và nhân vật tích hợp sẵn. Đây là phiên bản trung thực.
Liên kết tài khoản để nhận 1$, boost máy chủ để nhận 1$ mỗi tháng, săn lỗi để nhận tới 50$. Discord UnoRouter vừa mở cửa.