Hướng dẫn nền tảng

Lỗi & Giới hạn tốc độ

Mỗi mã trạng thái nghĩa là gì và cần làm gì với nó.

Định dạng lỗi

Lỗi trả về dưới dạng JSON theo định dạng lỗi của OpenAI. Thông báo nêu điều đã xảy ra, code là một định danh ổn định mà máy đọc được, và một id yêu cầu được thêm vào mỗi thông báo:

json

{
  "error": {
    "message": "Model \"gpt-5.5-typo\" is not offered here. Check the model name for typos, or switch to a model from our supported list. (request id: 20260705...)",
    "type": "new_api_error",
    "code": "model_not_found"
  }
}

Luôn kèm theo id yêu cầu khi bạn liên hệ hỗ trợ hoặc mở một ticket Discord. Nó cho phép chúng tôi tìm chính xác yêu cầu của bạn trong nhật ký.

Mã trạng thái nhìn nhanh

Các mã trạng thái bạn thực sự sẽ gặp:

Mã	Ý nghĩa	Cần làm gì
`400`	Yêu cầu không hợp lệ: giá trị tham số sai (ví dụ max_tokens dưới mức tối thiểu của mô hình) hoặc một prompt bị chặn bởi kiểm duyệt nội dung.	Sửa yêu cầu. Thử lại mà không thay đổi sẽ lại thất bại.
`401`	Vấn đề về khóa: khóa API thiếu, không hợp lệ, hết hạn hoặc bị vô hiệu hóa.	Kiểm tra header Authorization và khóa của bạn trên trang Token.
`402`	Giới hạn chi tiêu riêng của khóa này đã cạn.	Nâng giới hạn của khóa hoặc tạo một khóa mới.
`403`	Từ chối truy cập: số dư tài khoản trống, mô hình không được phép cho khóa này, hoặc IP của bạn không nằm trong danh sách cho phép của khóa.	Nạp tiền, hoặc kiểm tra các hạn chế mô hình và IP của khóa.
`413`	Yêu cầu quá lớn so với giới hạn dùng thử miễn phí của mô hình này.	Rút ngắn prompt hoặc chuyển sang mô hình trả phí.
`429`	Một giới hạn tốc độ đã kích hoạt (xem các loại bên dưới).	Chờ số giây trong Retry-After, rồi thử lại hoặc đổi mô hình.
`500`	Có gì đó thất bại ở phía chúng tôi hoặc ở nhà cung cấp upstream.	Thử lại sau một khoảng chờ ngắn; các 500 dai dẳng đáng để báo cáo.
`503`	Tất cả nhà cung cấp cho mô hình đều bận, hoặc tên mô hình không tồn tại.	Đọc thông báo: bận thì giải quyết trong vài phút, lỗi gõ thì không.

503: bận và mô hình không xác định

Hai tình huống rất khác nhau cùng chia sẻ trạng thái 503. Cái đầu tiên là tắc nghẽn tạm thời:

text

HTTP/1.1 503 Service Unavailable

{
  "error": {
    "message": "All providers for model \"kimi-k2.6:free\" are busy right now (they hit their rate limit). This is not a spelling error. Please try again in a little while, or switch to another model. (request id: 20260705...)",
    "type": "new_api_error",
    "code": "get_channel_failed"
  }
}

Mã get_channel_failed (tất cả nhà cung cấp đều bận) nghĩa là mọi nhà cung cấp miễn phí cho mô hình đó đang bị giới hạn tốc độ trong chốc lát. Điều này tự phục hồi trong vài phút: thử lại hoặc đổi mô hình. Mã model_not_found (không được cung cấp ở đây) nghĩa là chính tên mô hình không phân giải được, và thử lại sẽ không bao giờ giúp ích. Kiểm tra lỗi gõ hoặc tra tên hiện tại trong danh mục.

Hãy xử lý 503 với get_channel_failed như thử lại/dự phòng và 503 với model_not_found như một lỗi cứng trong client của bạn.

Các loại giới hạn tốc độ

Một 429 có thể đến từ nhiều lớp:

Giới hạn mô hình miễn phí của chúng tôi: 1 yêu cầu mỗi phút cho mỗi mô hình miễn phí cho mỗi người dùng. Một giới hạn công bằng để các nhóm dùng chung sống sót qua giờ cao điểm.
Giới hạn của nhà cung cấp upstream: nhà cung cấp đằng sau một mô hình miễn phí đã chạm giới hạn riêng của họ ("temporarily rate-limited upstream", tức là bị giới hạn tốc độ tạm thời ở phía upstream).
Ngân sách token hằng ngày trên một số nhóm miễn phí; chúng đặt lại vào nửa đêm UTC.
Giới hạn token mỗi phút kích hoạt trên các prompt rất lớn.
Giới hạn đồng thời cho mỗi người dùng khi quá nhiều yêu cầu chạy song song.

Các mô hình trả phí không có giới hạn tốc độ do UnoRouter áp đặt.

Giới hạn mô hình miễn phí chi tiết

Khi giới hạn 1 mỗi phút của chúng tôi kích hoạt, bạn nhận được các header giới hạn tốc độ tiêu chuẩn, để client có thể lùi lại chính xác:

text

HTTP/1.1 429 Too Many Requests
Retry-After: 38
X-RateLimit-Limit: 1
X-RateLimit-Remaining: 0
X-RateLimit-Reset: 1783198478

Retry-After có tính động: là số giây thực sự còn lại trong cửa sổ của bạn, không phải 60 cố định. Thông báo lỗi cũng nêu tên phiên bản trả phí song sinh của mô hình, vốn không có giới hạn.

Giới hạn kích thước dùng thử

Một số mô hình thường trả phí được cung cấp miễn phí với một giới hạn kích thước yêu cầu. Các prompt quá lớn nhận 413 với thông báo như: Request body too large for gpt-4.1 model. Max size: 8000 tokens.

Giới hạn chỉ áp dụng cho tuyến dùng thử miễn phí; mô hình trả phí nhận các prompt đầy đủ độ dài.

Hướng dẫn thử lại

Tôn trọng Retry-After trên 429. Thử lại 503 get_channel_failed sau một khoảng chờ ngắn, hoặc chuyển sang mô hình khác. Đừng thử lại các lỗi lớp 400, chúng có tính xác định.

Các yêu cầu thất bại và bị từ chối không bị tính phí: mọi khoản giữ trước trên số dư của bạn được hoàn lại khi yêu cầu báo lỗi.