भरोसा करने से पहले सत्यापित करें

एआई एपीआई मॉडल परीक्षक

जांचें कि कोई एंडपॉइंट वही वास्तविक मॉडल देता है जिसका वह दावा करता है। यह आपके ब्राउज़र में चलता है, आपकी कुंजी हमारे सर्वर पर नहीं भेजी जाती।

3कुल पहचान
1ट्रैक किए गए प्रदाता
100%औसत उत्तीर्ण दर
हम स्वयं को भी उसी मानक पर रखते हैंUnoRouter का परीक्षण इसी टूल से होता है। प्रमाण देखें।
GitHub issue खोलें

गिने जाने से पहले हर प्रकाशित परिणाम हमारे सर्वर पर दोबारा चलाया जाता है, और प्रत्येक निर्णय उसी सटीक प्रमाण से जुड़ता है जिसने उसे उत्पन्न किया। जिस परिणाम को आप ग़लत मानते हैं उस पर विवाद किया जा सकता है।Discord पर रिपोर्ट करेंGitHub issue खोलें

1 / 1

यह परीक्षक अलग क्यों है

नियतात्मक, अनुमान नहीं

प्रत्येक जाँच उत्तर में किसी ठोस संकेत से मेल खाती है, इसलिए हम असली मॉडलों को वैसे नकली चिह्नित नहीं करते जैसे सांख्यिकीय फ़िंगरप्रिंटिंग करती है। सटीक कोड पढ़ें।

प्रकाशन के लिए सर्वर-सत्यापित

कोई परिणाम सार्वजनिक बोर्ड तक तभी पहुँचता है जब हमारा सर्वर स्वयं पूरा परीक्षण दोबारा चलाता है, इसलिए रैंकिंग गढ़ी नहीं जा सकती।

ऐसा प्रमाण जो आप देख सकते हैं

हर निर्णय भेजा गया प्रॉम्प्ट, कच्चा उत्तर और वह मेल खाता पाठ दिखाता है जिसने उसे ट्रिगर किया। कुछ भी छिपाया नहीं जाता।

पहचान कैसे काम करती है
किसे नकली नहीं गिना जाता
  • संस्करण की अस्पष्टता एक असली मॉडल विक्रेता और स्तर की पुष्टि करता है पर अक्सर अपने सटीक संस्करण के बारे में अनिश्चित रहता है। यह अकेले कभी विफलता नहीं है, केवल सूचनात्मक रूप में चिह्नित किया जाता है।
  • अस्थायी त्रुटियाँ दर सीमाएँ (429), 5xx और टाइमआउट किसी रन को असत्यापित के रूप में चिह्नित करते हैं, कभी संदिग्ध के रूप में नहीं। बुरे क्षण से गुज़र रहे असली एंडपॉइंट को दंडित नहीं किया जाता।
  • क्लाउड होस्ट नाम होस्ट के रूप में AWS Bedrock, Google Vertex या Azure का नाम लेना स्वीकार्य है, क्योंकि ये असली मॉडल को पुनः बेचने के वैध तरीके हैं।
  • प्रोटोकॉल पुनराकार chat-completions और मूल messages प्रारूप के बीच अनुवाद करना सामान्य गेटवे व्यवहार है और जब मॉडल स्वयं असली हो तो यह धोखाधड़ी का संकेत नहीं है।
  • एक डगमगाता प्रोब चार में से तीन प्रोब पास होना असली माने जाने के लिए पर्याप्त है, इसलिए एक अकेला बेढंगा उत्तर किसी ईमानदार एंडपॉइंट को दोषी नहीं ठहराता।

यह पूरा परीक्षक ओपन सोर्स है। ठीक-ठीक पढ़ें कि कौन-कौन से प्रोब चलते हैं और क्यों: डिटेक्शन कोड देखें

बेहतर प्रोब के लिए कोई विचार है? इसे यहाँ सुझाएँ:GitHub issue खोलेंDiscord पर रिपोर्ट करें

अक्सर पूछे जाने वाले प्रश्न

ओपन सोर्स। इसे सत्यापित करें और सुधारें।

परीक्षण कोड खुला है। देखें कि कौन सी जांच क्यों चलती हैं, नई जांच सुझाएं, या हमारे Discord पर पहचान पर चर्चा करें।