先验证再信任

AI API 模型检测器

检查端点是否真正提供其声称的模型。在你的浏览器中运行,你的密钥不会发送到我们的服务器。

3检测总数
1追踪的提供商
100%平均通过率
我们对自己也坚持同样的标准UnoRouter 也由这同一款工具测试。查看证据。
提交一个 GitHub issue

每条已发布的结果在计入之前都会在我们的服务器上重新运行,且每条判定都会链接到产生它的确切证据。你认为有误的结果可以申诉。在 Discord 上报告提交一个 GitHub issue

1 / 1

这款检测器为何与众不同

确定性的,而非猜测

每项检查都匹配回复中的具体信号,因此我们不会像统计指纹那样把真实模型误标为伪造。请阅读确切的代码。

经服务器验证方可发布

结果只有在我们的服务器亲自重新运行整套测试之后才会登上公开榜单,因此排名无法伪造。

你能看见的证据

每条判定都会显示发送的提示、原始回复,以及触发它的匹配文本。没有任何东西被隐藏。

检测如何工作
什么不会被计为伪造
  • 版本含糊 真实模型会确认厂商和层级,但往往不确定自己的确切版本。仅此一点绝不算失败,只标记为提示性信息。
  • 临时错误 速率限制(429)、5xx 和超时会把一次运行标记为未验证,绝不标记为可疑。真实端点偶尔状态不佳并不会被惩罚。
  • 云主机名称 把 AWS Bedrock、Google Vertex 或 Azure 说成主机是被接受的,因为这些都是转售真实模型的合法方式。
  • 协议重塑 在 chat-completions 与原生 messages 格式之间转换是正常的网关行为,只要模型本身是真实的,就不是欺诈信号。
  • 单个不稳定的探针 四个探针中通过三个就足以判定为真实,因此单个偏差回答不会让诚实的端点蒙冤。

整个测试器都是开源的。准确了解运行了哪些探测以及原因: 查看检测代码

对更好的探测有想法吗?在这里提交:提交一个 GitHub issue在 Discord 上报告

常见问题

开源。欢迎验证与改进。

检测代码是开源的。你可以查看具体运行了哪些探测以及原因,建议新的检测,或在我们的 Discord 上讨论检测方法。