搜尋文件...

開始輸入以搜尋文件

平台指南

模型與定價

:free 後綴的含義、用量如何計價,以及模型為何有時會消失。

目錄

模型頁面列出每個模型的脈絡視窗、按權杖的價格、支援的端點,以及工具呼叫和影像輸入等能力篩選項。每個模型都有自己的頁面,附帶即複製即用的程式碼範例。並非所有免費模型都支援工具呼叫或視覺,因此在將某個模型接入編碼代理之前,請先查看能力徽章。

排行榜根據社群測試結果顯示哪些免費模型確實可靠。狀態頁面即時追蹤供應商的運作狀況。

免費模型與付費模型

免費模型帶有 :free 後綴,例如 gpt-oss-120b:free

:free 模型只路由到免費的上游供應商,絕不觸及你的餘額。不帶後綴的同一基礎名稱是付費版本:穩定、無上限、按權杖計費。兩者可以並存,因此從免費切換到付費只是改一個字串。

免費模型免費是有原因的:速率限制由上游供應商設定,而非我們。尖峰時段請預期會收到 429 回應,需要可靠度時請使用付費模型。

定價的運作方式

大多數模型按權杖計費,輸入和輸出價格分開。少數模型(大多為影像和影片)改為按次收取固定費用。你在模型頁面看到的就是你要支付的:沒有訂閱,沒有隱藏費用,你的餘額只是隨每次請求而減少。

定價頁面提供目前的儲值選項;每個模型頁面都會顯示即時的按權杖價格。

提示詞快取

對於支援提示詞快取的模型(Claude 等),重複的提示詞前綴按較低的快取輸入費率計費,而寫入一筆新的快取項目則比一般輸入權杖略貴(約 1.25 倍)。

快取是自動的。具有長而穩定的系統提示詞的工作負載(代理、RP 預設集)獲益最多,無需任何設定。

可用性與容錯移轉

當一個免費模型有多個上游供應商時,若某個供應商達到其速率限制,請求會自動容錯移轉到下一個。單一供應商的模型無法容錯移轉,因此會一直停滯,直到限制重設。

每個模型都透過一個或多個供應商通道運行。達到速率限制的通道會被暫時停用並隱藏,在其恢復期間不會作為選項顯示。只要還有一個通道在線,模型就會繼續透過它運作。只有當一個模型的每個通道都被速率限制時,模型本身才會從目錄中消失。

在高負載下模型從清單中消失是預期行為,而非拼字錯誤或服務中斷。一旦某個通道通過健康檢查,它就會自行重新出現,通常在幾分鐘之內。如果儲存的模型名稱無法再解析,請查看模型頁面:它要麼正在恢復,要麼已被重新命名。

模型與定價詳解