איגדנו יותר מ-100 מודלי AI חינמיים לנקודת קצה אחת
במהלך יומיים חיברנו 15 ספקים חינמיים אל UnoRouter: 134 שורות מודלים חינמיים, נקודת קצה אחת תואמת OpenAI-compatible, $0 לכל טוקן. הם חינמיים מסיבה טובה ונושאים מגבלות קצב שאיננו יכולים להגדיל. הנה הגרסה הכנה.
נוף ה-LLM החינמי אמיתי אך מפוזר: Groq, Gemini, Cloudflare, Mistral, OVHcloud ועוד תריסר ספקים, כל אחד מהם מחלק קיבולת אמיתית, מאחורי תריסר עמודי הרשמה, תריסר פורמטים של מפתחות, ותריסר ממשקי API לא תואמים. במהלך יומיים גילינו, בדקנו ומיזגנו לתוך UnoRouter כל ספק לגיטימי עם שכבה חינמית קבועה שהצלחנו למצוא. התוצאה: 134 שורות מודלים חינמיים מ-15 ספקים מאחורי נקודת קצה אחת תואמת OpenAI-compatible ומפתח אחד.
מה הוספנו
חמישה עשר ספקים חינמיים, אחד אחרי השני: Groq, Gemini, Cerebras, SambaNova, Mistral, Cloudflare Workers AI (שני חשבונות), GitHub Models, Z.ai, OVHcloud, AI Horde, Pollinations, Cohere, Jina, NVIDIA NIM, ו-OpenRouter. אלו 134 שורות מודלים חינמיים: Llama, gpt-oss, Qwen, Mistral, GLM, Nemotron ועוד, בתוספת 30 מודלי embedding חינמיים ו-13 מודלי תמונה ואודיו חינמיים. כל אחד מהם נבדק מקצה לקצה עבור HTTP, סטרימינג וקריאות כלים לפני שהוא עולה לאוויר, אותן בדיקות אותנטיות ומסגרת בדיקה שאנו מריצים על מודלים בתשלום.
חינמיים מסיבה טובה
המודלים האלה חינמיים באמת, וזו בדיוק הסיבה שיש להם מגבלות. הספק קובע את המגבלות האלה, לא אנחנו, ואיננו יכולים להגדיל אותן. כל ספק במעלה הזרם אוכף מגבלות קצב משלו: בקשות לדקה, מכסות טוקנים יומיות, תקציבי נוירונים של Cloudflare, עדיפות בתור מתנדבים. הגעתם לתקרה והספק הזה מחזיר 429 עד שהוא מתאפס. מפתח חינמי שעבד הבוקר עלול להיות מנוצל עד תום עד הצהריים. השכבה החינמית היא תפוקה במאמץ מיטבי, לא הבטחה. אם העומס שלכם דורש זמן תגובה צפוי ובלי הפתעות של 429, השתמשו במודל בתשלום.
למה בכלל לאגד אותם
כי החלופה היא חמישה עשר חשבונות. לכל ספק יש הרשמה משלו, פורמט מפתח משלו, כתובת בסיס משלו, ומוזרויות משלו: Z.ai מדבר את נתיב Zhipu V4, Cloudflare נושא את מזהה החשבון בכתובת, AI Horde רוצה מפתח אנונימי, GitHub חוסם מודלים מאחורי היקף הרשאה של טוקן. ספגנו את כל זה כדי שתקראו להם כמו שאתם קוראים לכל דבר אחר: נקודת קצה אחת תואמת OpenAI-compatible, מפתח אחד, שם מודל. הכלל הכן שאנחנו מחויבים אליו: חשבון אמיתי אחד לכל ספק, התקרות מתקבלות, שום דבר לא מנוצל לרעה, שום דבר לא מאוגד יחד. אנחנו חושפים את השכבה החינמית כמתנה, לא כמכירה חוזרת של מכסה של מישהו אחר.
איך אנחנו מרככים את המגבלות
רבים מהמודלים האלה מוגשים על ידי יותר מספק חינמי אחד. Llama 3.3 70B לבדו רץ על שבעה מהם. כשכמה ספקים מציעים את אותו מודל, אנחנו מאחדים אותם לשם פרסום אחד ומבצעים מעבר אוטומטי במקרה כשל: אם ספק אחד במעלה הזרם מחזיר 429 או משתתק, הספק הבא במצב תקין שמגיש את המודל הזה מקבל את הבקשה. זה הידית האחת שאנחנו כן שולטים בה. זה לא מגדיל את התקרה של אף ספק בודד, אבל זה אומר שמודל חינמי מרובה מקורות ממשיך לענות הרבה אחרי שאחד מהספקים שלו מוצה. למודלים חינמיים ממקור יחיד אין גיבוי, אז הם נתקעים כשהספק היחיד שלהם נגמר.
מה לא עשינו
לא הוספנו פרוקסי הפוכים שמגישים מחדש את מודלי הדגל של OpenAI או Claude ללא רשות. לא הכנסנו מאגדי מפתחות אישיים שהטוקנים שלהם אינם ניתנים להעברה, או שירותי מאגר-של-מאגרים שמנצלים לרעה ומסובבים את המפתחות של אנשים אחרים. אלו קיימים והם מפתים והם בדיוק הבלגן של השוק האפור שהשער הזה נועד להחליף. כל ספק ברשימה מחלק את השכבה החינמית שלו במכוון, בתנאים שלו. אם מקור לא הצליח לעבור את הרף הזה, הוא לא כאן.
נסו את זה
כל 134 המודלים החינמיים פעילים מאחורי נקודת קצה אחת תואמת OpenAI-compatible. קבלו מפתח API או עיינו בקטלוג המודלים וסננו לחינמיים. רק זכרו על איזו שכבה אתם נמצאים כשמופיע 429.
UnoRouter רשום במדריכי כלי הבינה המלאכותית והסטארטאפים. כאן תוכלו למצוא אותנו, לאמת את הרישומים ולקרוא חוות דעת עצמאיות.
גם UnoRouter וגם OpenRouter מעמידים מודלים רבים מאחורי מפתח אחד תואם OpenAI. ההבדל הוא מה שיושב מעל: API ללא ממשק, או API בתוספת לקוח צ'אט ודמויות מובנה. הנה הגרסה הכנה.
קשרו את החשבון שלכם תמורת $1, בוסטו את השרת תמורת $1 בכל חודש, צודו באגים תמורת עד $50. בדיוק פתחנו את ה-Discord של UnoRouter.