信頼する前に検証

AI APIモデルテスター

エンドポイントが名乗るモデルを本当に提供しているか確認します。ブラウザで実行され、キーは当社サーバーに送信されません。

リクエスト設定

エンドポイントとキーを設定し、ブラウザでテストを実行します。

API形式
共有されるのはホスト、モデル、スコアのみです。キーは決して共有されません。

このテスターが他と違う理由

推測ではなく決定論的

各チェックは応答内の具体的なシグナルと一致するため、統計的フィンガープリンティングのように本物のモデルを偽物と誤判定することはありません。正確なコードをご覧ください。

公開にはサーバー検証が必須

結果は、当社のサーバーがテスト全体を自ら再実行した後にのみ公開ボードに掲載されるため、ランキングを偽造することはできません。

目で見える証拠

すべての判定は、送信したプロンプト、生の応答、そしてそれを引き起こした一致テキストを表示します。隠すものは何もありません。

検出の仕組み
偽物として数えられないもの
  • バージョンの曖昧さ 本物のモデルはベンダーとティアを確認しますが、正確なバージョンについてはしばしば不確かです。それ自体は決して不合格にはならず、参考情報として記録されるだけです。
  • 一時的なエラー レート制限(429)、5xx、タイムアウトは実行を未検証として扱い、決して疑わしいとはしません。本物のエンドポイントが調子の悪い瞬間に当たっても罰せられません。
  • クラウドホスト名 ホストとして AWS Bedrock、Google Vertex、Azure を名乗ることは許容されます。これらは本物のモデルを再販する正当な手段だからです。
  • プロトコルの整形変換 chat-completions とネイティブの messages 形式の間で変換することは通常のゲートウェイの挙動であり、モデル自体が本物であれば不正の兆候ではありません。
  • 1 つの不安定なプローブ 4 つのうち 3 つのプローブが通れば本物と見なすのに十分なので、1 つの的外れな回答だけで正直なエンドポイントを断罪することはありません。

このテスターは全体がオープンソースです。どのプローブがなぜ実行されるかを正確に確認できます: 検出コードを見る

より良いプローブのアイデアはありますか?こちらで提案してください:GitHub の issue を開くDiscord で報告

よくある質問

オープンソース。検証して改善できます。

テストコードは公開されています。どのプローブがなぜ実行されるかを確認し、新しいテストを提案したり、Discord で検出について議論できます。

AI APIモデルテスター | UnoRouter