Verifica prima di fidarti

Tester di modelli API IA

Verifica se un endpoint fornisce il modello reale dichiarato. Funziona nel browser, la tua chiave non viene inviata ai nostri server.

3Rilevamenti totali
1Provider monitorati
100%Tasso medio di successo
Applichiamo a noi stessi lo stesso metroUnoRouter è testato con questo stesso strumento. Guarda le prove.
Apri una issue su GitHub

Ogni risultato pubblicato viene rieseguito sul nostro server prima di essere conteggiato, e ogni verdetto rimanda alle prove esatte che lo hanno prodotto. Un risultato che ritieni errato può essere contestato.Segnala su DiscordApri una issue su GitHub

1 / 1

Perché questo tester è diverso

Deterministico, non una congettura

Ogni controllo corrisponde a un segnale concreto nella risposta, quindi non contrassegniamo i modelli reali come falsi nel modo in cui fa l'impronta statistica. Leggi il codice esatto.

Verificato lato server per la pubblicazione

Un risultato raggiunge la bacheca pubblica solo dopo che il nostro server ha rieseguito l'intero test, così le classifiche non possono essere falsificate.

Prove che puoi vedere

Ogni verdetto mostra il prompt inviato, la risposta grezza e il testo corrispondente che lo ha innescato. Niente viene nascosto.

Come funziona il rilevamento
Cosa NON viene conteggiato come falso
  • Vaghezza sulla versione un modello autentico conferma il fornitore e il livello ma spesso non è sicuro della versione esatta. Questo da solo non è mai un fallimento, viene solo segnalato a titolo informativo.
  • Errori temporanei i limiti di frequenza (429), i 5xx e i timeout contrassegnano un'esecuzione come non verificata, mai come sospetta. Un endpoint reale che attraversa un brutto momento non viene penalizzato.
  • Nomi di host cloud indicare AWS Bedrock, Google Vertex o Azure come host è accettato, poiché sono modi legittimi di rivendere il modello reale.
  • Riformattazione del protocollo tradurre tra chat-completions e il formato messages nativo è un normale comportamento del gateway e non è un segnale di frode quando il modello stesso è autentico.
  • Una sonda instabile tre sonde superate su quattro bastano per essere autentici, quindi una singola risposta fuori posto non condanna un endpoint onesto.

L'intero tester è open source. Leggi esattamente quali sonde vengono eseguite e perché: Vedi il codice di rilevamento

Hai un'idea per una sonda migliore? Proponila qui:Apri una issue su GitHubSegnala su Discord

Domande frequenti

Open source. Verificalo e miglioralo.

Il codice dei test e aperto. Vedi esattamente quali sonde vengono eseguite e perche, proponi nuovi test o discuti il rilevamento sul nostro Discord.