Tìm tài liệu...

Bắt đầu gõ để tìm tài liệu

Hướng dẫn nền tảng

Mô hình & Giá

Hậu tố :free nghĩa là gì, việc sử dụng được tính giá thế nào và tại sao đôi khi một mô hình biến mất.

Danh mục

Trang Mô hình liệt kê mọi mô hình với cửa sổ ngữ cảnh, giá theo token, các endpoint được hỗ trợ và bộ lọc năng lực như gọi công cụ và đầu vào hình ảnh. Mỗi mô hình có trang riêng với các ví dụ mã sẵn sàng sao chép-dán. Không phải mọi mô hình miễn phí đều hỗ trợ gọi công cụ hoặc thị giác, vì vậy hãy kiểm tra huy hiệu năng lực trước khi kết nối một mô hình vào tác nhân lập trình.

Bảng xếp hạng cho thấy mô hình miễn phí nào thực sự đáp ứng, dựa trên kết quả kiểm tra của cộng đồng. Trạng thái theo dõi tình trạng nhà cung cấp trực tiếp.

Mô hình miễn phí và trả phí

Các mô hình miễn phí mang hậu tố :free, ví dụ gpt-oss-120b:free

Một mô hình :free chỉ định tuyến tới các nhà cung cấp upstream miễn phí và không bao giờ chạm vào số dư của bạn. Cùng tên cơ sở nhưng không có hậu tố là phiên bản trả phí: ổn định, không giới hạn và tính phí theo token. Cả hai có thể tồn tại song song, nên chuyển từ miễn phí sang trả phí chỉ là thay đổi một chuỗi.

Mô hình miễn phí miễn phí có lý do: chính các nhà cung cấp upstream đặt giới hạn tốc độ, không phải chúng tôi. Hãy mong đợi phản hồi 429 vào giờ cao điểm, và dùng mô hình trả phí khi bạn cần độ tin cậy.

Giá hoạt động như thế nào

Hầu hết mô hình tính phí theo token, với giá đầu vào và đầu ra riêng biệt. Một vài mô hình (chủ yếu là hình ảnh và video) thay vào đó tính một mức giá cố định mỗi lần gọi. Những gì bạn thấy trên trang mô hình là những gì bạn trả: không đăng ký, không phí ẩn, số dư của bạn chỉ đơn giản giảm theo mỗi yêu cầu.

Trang Giá có các tùy chọn nạp tiền hiện tại; mỗi trang mô hình hiển thị giá theo token trực tiếp.

Bộ nhớ đệm prompt

Đối với các mô hình hỗ trợ bộ nhớ đệm prompt (Claude và những mô hình khác), các tiền tố prompt lặp lại được tính theo mức phí đầu vào đã lưu trong bộ nhớ đệm giảm hơn, trong khi việc ghi một mục cache mới tốn hơn một chút so với token đầu vào thông thường (khoảng 1,25x).

Bộ nhớ đệm là tự động. Các khối lượng công việc với prompt hệ thống dài và ổn định (tác nhân, preset RP) được hưởng lợi nhiều nhất, không cần cấu hình gì.

Tính khả dụng & chuyển đổi dự phòng

Khi một mô hình miễn phí có nhiều nhà cung cấp upstream, các yêu cầu tự động chuyển đổi dự phòng sang nhà cung cấp kế tiếp nếu một nhà cung cấp chạm giới hạn tốc độ. Các mô hình một nhà cung cấp không thể chuyển đổi dự phòng, nên chúng đình trệ cho đến khi giới hạn được đặt lại.

Mỗi mô hình chạy qua một hoặc nhiều kênh nhà cung cấp. Một kênh chạm giới hạn tốc độ của nó sẽ bị vô hiệu hóa và ẩn tạm thời, nó không được hiển thị như một lựa chọn trong khi đang phục hồi. Miễn là còn một kênh hoạt động, mô hình vẫn tiếp tục làm việc qua kênh đó. Chỉ khi mọi kênh của một mô hình đều bị giới hạn tốc độ thì bản thân mô hình mới biến mất khỏi danh mục.

Việc một mô hình biến mất khỏi danh sách là điều bình thường khi tải cao, không phải lỗi đánh máy hay sự cố ngừng hoạt động. Nó tự xuất hiện lại ngay khi một kênh vượt qua lần kiểm tra tình trạng, thường trong vòng vài phút. Nếu một tên mô hình đã lưu ngừng phân giải, hãy kiểm tra trang Mô hình: nó đang phục hồi hoặc đã được đổi tên.

Giải thích mô hình & giá