模型与定价
:free 后缀的含义、用量如何计价,以及模型为何有时会消失。
目录
模型页面列出每个模型的上下文窗口、按令牌的价格、支持的端点,以及工具调用和图像输入等能力筛选项。每个模型都有自己的页面,附带即复制即用的代码示例。并非所有免费模型都支持工具调用或视觉,因此在将某个模型接入编码代理之前,请先查看能力徽章。
排行榜根据社区测试结果显示哪些免费模型确实靠谱。状态页面实时跟踪提供商的运行状况。
免费模型与付费模型
免费模型带有 :free 后缀,例如 gpt-oss-120b:free
:free 模型只路由到免费的上游提供商,绝不触及你的余额。不带后缀的同一基础名称是付费版本:稳定、无上限、按令牌计费。两者可以并存,因此从免费切换到付费只是改一个字符串。
免费模型免费是有原因的:速率限制由上游提供商设定,而非我们。高峰时段请预期会收到 429 响应,需要可靠性时请使用付费模型。
定价的运作方式
大多数模型按令牌计费,输入和输出价格分开。少数模型(大多为图像和视频)改为按次收取固定费用。你在模型页面看到的就是你要支付的:没有订阅,没有隐藏费用,你的余额只是随每次请求而减少。
定价页面提供当前的充值选项;每个模型页面都会显示实时的按令牌价格。
提示词缓存
对于支持提示词缓存的模型(Claude 等),重复的提示词前缀按较低的缓存输入费率计费,而写入一条新的缓存条目则比普通输入令牌略贵(约 1.25 倍)。
缓存是自动的。具有长而稳定的系统提示词的工作负载(代理、RP 预设)获益最多,无需任何配置。
可用性与故障转移
当一个免费模型有多个上游提供商时,如果某个提供商达到其速率限制,请求会自动故障转移到下一个。单一提供商的模型无法故障转移,因此会一直停滞,直到限制重置。
每个模型都通过一个或多个供应商通道运行。达到速率限制的通道会被临时禁用并隐藏,在其恢复期间不会作为选项显示。只要还有一个通道在线,模型就会继续通过它工作。只有当一个模型的每个通道都被速率限制时,模型本身才会从目录中消失。
在高负载下模型从列表中消失是预期行为,而非拼写错误或服务中断。一旦某个通道通过健康检查,它就会自行重新出现,通常在几分钟之内。如果保存的模型名称无法再解析,请查看模型页面:它要么正在恢复,要么已被重命名。