מדריך הפלטפורמה

שגיאות ומגבלות קצב

מה המשמעות של כל קוד סטטוס ומה לעשות בנוגע אליו.

פורמט השגיאה

שגיאות חוזרות כ-JSON בפורמט השגיאות של OpenAI. ה-message מציין מה קרה, ה-code הוא מזהה יציב וקריא-מכונה, ומזהה בקשה מצורף לכל הודעה:

json

{
  "error": {
    "message": "Model \"gpt-5.5-typo\" is not offered here. Check the model name for typos, or switch to a model from our supported list. (request id: 20260705...)",
    "type": "new_api_error",
    "code": "model_not_found"
  }
}

תמיד כלול את מזהה הבקשה כשאתה פונה לתמיכה או פותח כרטיס ב-Discord. הוא מאפשר לנו למצוא את הבקשה המדויקת שלך ביומנים.

קודי סטטוס במבט חטוף

קודי הסטטוס שבאמת תיתקל בהם:

קוד	משמעות	מה לעשות
`400`	בקשה לא חוקית: ערכי פרמטרים שגויים (למשל max_tokens מתחת למינימום של המודל) או פרומפט שנחסם על ידי בקרת תוכן.	תקן את הבקשה. ניסיון חוזר ללא שינוי ייכשל שוב.
`401`	בעיית מפתח: מפתח API חסר, לא חוקי, פג תוקף או מושבת.	בדוק את הכותרת Authorization ואת המפתח שלך בעמוד האסימונים.
`402`	מגבלת ההוצאה של המפתח הזה עצמו מוצתה.	העלה את מגבלת המפתח או צור מפתח חדש.
`403`	הגישה נדחתה: יתרת החשבון ריקה, המודל אינו מותר למפתח הזה, או שכתובת ה-IP שלך אינה ברשימת ההיתר של המפתח.	טען יתרה, או בדוק את הגבלות המודל וה-IP של המפתח.
`413`	הבקשה גדולה מדי עבור תקרת הניסיון החינמי של המודל הזה.	קצר את הפרומפט או עבור למודל בתשלום.
`429`	מגבלת קצב הופעלה (ראה את הסוגים למטה).	המתן את מספר השניות ב-Retry-After, ואז נסה שוב או החלף מודל.
`500`	משהו נכשל בצד שלנו או אצל ספק המקור.	נסה שוב לאחר המתנה קצרה; שגיאות 500 מתמשכות ראויות לדיווח.
`503`	כל הספקים של המודל עסוקים, או ששם המודל אינו קיים.	קרא את ההודעה: עומס נפתר תוך דקות, שגיאת הקלדה לא.

503: עסוק מול מודל לא ידוע

שני מצבים שונים מאוד חולקים את סטטוס 503. הראשון הוא עומס זמני:

text

HTTP/1.1 503 Service Unavailable

{
  "error": {
    "message": "All providers for model \"kimi-k2.6:free\" are busy right now (they hit their rate limit). This is not a spelling error. Please try again in a little while, or switch to another model. (request id: 20260705...)",
    "type": "new_api_error",
    "code": "get_channel_failed"
  }
}

הקוד get_channel_failed (כל הספקים עסוקים) פירושו שכל ספק חינמי של המודל הזה מוגבל קצב לרגע. זה מתאושש לבד תוך דקות: נסה שוב או החלף מודל. הקוד model_not_found (לא מוצע כאן) פירושו ששם המודל עצמו אינו נפתר, וניסיון חוזר לעולם לא יעזור. בדוק שגיאות הקלדה או חפש את השם הנוכחי בקטלוג.

התייחס ל-503 עם get_channel_failed כניסיון חוזר או גיבוי, ול-503 עם model_not_found כשגיאה קשה בלקוח שלך.

סוגי מגבלות הקצב

429 יכול להגיע מכמה שכבות:

תקרת המודלים החינמיים שלנו: בקשה אחת לדקה לכל מודל חינמי לכל משתמש. תקרת הוגנות כדי שמאגרים משותפים ישרדו את שעות העומס.
מגבלות ספק המקור: הספק שמאחורי מודל חינמי הגיע לתקרה שלו עצמו ("temporarily rate-limited upstream", כלומר מוגבל קצב זמנית במקור).
תקציבי אסימונים יומיים בחלק מהמאגרים החינמיים; הם מתאפסים בחצות לפי UTC.
תקרות אסימונים לדקה שמופעלות על פרומפטים גדולים מאוד.
מגבלת מקביליות לכל משתמש כאשר יותר מדי בקשות רצות במקביל.

למודלים בתשלום אין מגבלות קצב שמוטלות על ידי UnoRouter.

מגבלת המודלים החינמיים בפירוט

כשהתקרה שלנו של 1 לדקה מופעלת אתה מקבל כותרות מגבלת קצב סטנדרטיות, כך שלקוחות יכולים להאט במדויק:

text

HTTP/1.1 429 Too Many Requests
Retry-After: 38
X-RateLimit-Limit: 1
X-RateLimit-Remaining: 0
X-RateLimit-Reset: 1783198478

Retry-After הוא דינמי: מספר השניות שנותרו בפועל בחלון שלך, לא 60 קבוע. הודעת השגיאה גם מציינת את התאום בתשלום של המודל, שאין לו מגבלה.

תקרות גודל של הניסיון

חלק מהמודלים שבדרך כלל בתשלום מוצעים בחינם עם תקרה על גודל הבקשה. פרומפטים גדולים מדי מקבלים 413 עם הודעה כמו: Request body too large for gpt-4.1 model. Max size: 8000 tokens.

התקרה חלה רק על מסלול הניסיון החינמי; המודל בתשלום מקבל פרומפטים באורך מלא.

הנחיות לניסיון חוזר

כבד את Retry-After ב-429. נסה שוב 503 get_channel_failed לאחר המתנה קצרה, או עבור למודל אחר. אל תנסה שוב שגיאות ממחלקת 400, הן דטרמיניסטיות.

בקשות שנכשלו ונדחו אינן מחויבות: כל שמירה מוקדמת על היתרה שלך מוחזרת כאשר הבקשה נכשלת.