信頼する前に検証
AI APIモデルテスター
エンドポイントが名乗るモデルを本当に提供しているか確認します。ブラウザで実行され、キーは当社サーバーに送信されません。
プロバイダーに戻る
テストが見つかりません。
このテスターが他と違う理由
推測ではなく決定論的
各チェックは応答内の具体的なシグナルと一致するため、統計的フィンガープリンティングのように本物のモデルを偽物と誤判定することはありません。正確なコードをご覧ください。
公開にはサーバー検証が必須
結果は、当社のサーバーがテスト全体を自ら再実行した後にのみ公開ボードに掲載されるため、ランキングを偽造することはできません。
目で見える証拠
すべての判定は、送信したプロンプト、生の応答、そしてそれを引き起こした一致テキストを表示します。隠すものは何もありません。
偽物として数えられないもの
- バージョンの曖昧さ 本物のモデルはベンダーとティアを確認しますが、正確なバージョンについてはしばしば不確かです。それ自体は決して不合格にはならず、参考情報として記録されるだけです。
- 一時的なエラー レート制限(429)、5xx、タイムアウトは実行を未検証として扱い、決して疑わしいとはしません。本物のエンドポイントが調子の悪い瞬間に当たっても罰せられません。
- クラウドホスト名 ホストとして AWS Bedrock、Google Vertex、Azure を名乗ることは許容されます。これらは本物のモデルを再販する正当な手段だからです。
- プロトコルの整形変換 chat-completions とネイティブの messages 形式の間で変換することは通常のゲートウェイの挙動であり、モデル自体が本物であれば不正の兆候ではありません。
- 1 つの不安定なプローブ 4 つのうち 3 つのプローブが通れば本物と見なすのに十分なので、1 つの的外れな回答だけで正直なエンドポイントを断罪することはありません。
このテスターは全体がオープンソースです。どのプローブがなぜ実行されるかを正確に確認できます: 検出コードを見る
より良いプローブのアイデアはありますか?こちらで提案してください:GitHub の issue を開くDiscord で報告
オープンソース。検証して改善できます。
テストコードは公開されています。どのプローブがなぜ実行されるかを確認し、新しいテストを提案したり、Discord で検出について議論できます。