Guvenmeden once dogrulayin
Yapay Zeka API Model Testleyici
Bir uc noktanin iddia ettigi gercek modeli sunup sunmadigini kontrol edin. Tarayicida calisir, anahtariniz sunucularimiza gonderilmez.
Yayınlanan her sonuç sayılmadan önce sunucumuzda yeniden çalıştırılır ve her karar, onu üreten tam kanıta bağlanır. Yanlış olduğunu düşündüğünüz bir sonuca itiraz edilebilir.Discord'da bildirGitHub'da bir sorun aç
Bu test aracı neden farklı
Her kontrol yanıttaki somut bir sinyalle eşleşir, bu yüzden istatistiksel parmak izi yönteminin yaptığı gibi gerçek modelleri sahte olarak işaretlemeyiz. Tam kodu okuyun.
Bir sonuç, ancak sunucumuz tüm testi kendisi yeniden çalıştırdıktan sonra herkese açık panoya ulaşır, böylece sıralamalar sahte olarak üretilemez.
Her karar, gönderilen istemi, ham yanıtı ve onu tetikleyen eşleşen metni gösterir. Hiçbir şey gizlenmez.
- Sürüm belirsizliği gerçek bir model sağlayıcıyı ve kademeyi doğrular ama tam sürümünden çoğu zaman emin değildir. Bu tek başına asla bir başarısızlık değildir, yalnızca bilgilendirme olarak işaretlenir.
- Geçici hatalar hız sınırları (429), 5xx ve zaman aşımları bir çalışmayı doğrulanmamış olarak işaretler, asla şüpheli olarak değil. Kötü bir an yaşayan gerçek bir uç nokta cezalandırılmaz.
- Bulut sunucu adları AWS Bedrock, Google Vertex ya da Azure'u sunucu olarak adlandırmak kabul edilir, çünkü bunlar gerçek modeli yeniden satmanın meşru yollarıdır.
- Protokol yeniden biçimlendirme chat-completions ile yerel messages biçimi arasında çeviri yapmak normal bir ağ geçidi davranışıdır ve modelin kendisi gerçekse bir dolandırıcılık işareti değildir.
- Tek bir kararsız sonda dört sondadan üçünün geçmesi gerçek olmak için yeterlidir, dolayısıyla tek bir tutarsız yanıt dürüst bir uç noktayı mahkum etmez.
Bu test aracının tamamı açık kaynaktır. Hangi probların neden çalıştığını tam olarak okuyun: Tespit kodunu görüntüle
Daha iyi bir prob için fikrin mi var? Buradan öner:GitHub'da bir sorun açDiscord'da bildir
Acik kaynak. Dogrulayin ve gelistirin.
Test kodu aciktir. Hangi sondalarin neden calistigini tam olarak gorun, yeni testler onerin veya tespiti Discord'umuzda tartisin.