平台指南

模型与定价

:free 后缀的含义、用量如何计价，以及模型为何有时会消失。

模型页面列出每个模型的上下文窗口、按令牌的价格、支持的端点，以及工具调用和图像输入等能力筛选项。每个模型都有自己的页面，附带即复制即用的代码示例。并非所有免费模型都支持工具调用或视觉，因此在将某个模型接入编码代理之前，请先查看能力徽章。

排行榜根据社区测试结果显示哪些免费模型确实靠谱。状态页面实时跟踪提供商的运行状况。

免费模型与付费模型

免费模型带有 :free 后缀，例如 gpt-oss-120b:free

:free 模型只路由到免费的上游提供商，绝不触及你的余额。不带后缀的同一基础名称是付费版本：稳定、无上限、按令牌计费。两者可以并存，因此从免费切换到付费只是改一个字符串。

免费模型免费是有原因的：速率限制由上游提供商设定，而非我们。高峰时段请预期会收到 429 响应，需要可靠性时请使用付费模型。

大多数模型按令牌计费，输入和输出价格分开。少数模型（大多为图像和视频）改为按次收取固定费用。你在模型页面看到的就是你要支付的：没有订阅，没有隐藏费用，你的余额只是随每次请求而减少。

定价页面提供当前的充值选项；每个模型页面都会显示实时的按令牌价格。

对于支持提示词缓存的模型（Claude 等），重复的提示词前缀按较低的缓存输入费率计费，而写入一条新的缓存条目则比普通输入令牌略贵（约 1.25 倍）。

缓存是自动的。具有长而稳定的系统提示词的工作负载（代理、RP 预设）获益最多，无需任何配置。

当一个免费模型有多个上游提供商时，如果某个提供商达到其速率限制，请求会自动故障转移到下一个。单一提供商的模型无法故障转移，因此会一直停滞，直到限制重置。

每个模型都通过一个或多个供应商通道运行。达到速率限制的通道会被临时禁用并隐藏，在其恢复期间不会作为选项显示。只要还有一个通道在线，模型就会继续通过它工作。只有当一个模型的每个通道都被速率限制时，模型本身才会从目录中消失。

在高负载下模型从列表中消失是预期行为，而非拼写错误或服务中断。一旦某个通道通过健康检查，它就会自行重新出现，通常在几分钟之内。如果保存的模型名称无法再解析，请查看模型页面：它要么正在恢复，要么已被重命名。