भरोसा करने से पहले सत्यापित करें
एआई एपीआई मॉडल परीक्षक
जांचें कि कोई एंडपॉइंट वही वास्तविक मॉडल देता है जिसका वह दावा करता है। यह आपके ब्राउज़र में चलता है, आपकी कुंजी हमारे सर्वर पर नहीं भेजी जाती।
अनुरोध कॉन्फ़िगरेशन
एंडपॉइंट और कुंजी कॉन्फ़िगर करें, फिर अपने ब्राउज़र में परीक्षण चलाएं।
यह परीक्षक अलग क्यों है
प्रत्येक जाँच उत्तर में किसी ठोस संकेत से मेल खाती है, इसलिए हम असली मॉडलों को वैसे नकली चिह्नित नहीं करते जैसे सांख्यिकीय फ़िंगरप्रिंटिंग करती है। सटीक कोड पढ़ें।
कोई परिणाम सार्वजनिक बोर्ड तक तभी पहुँचता है जब हमारा सर्वर स्वयं पूरा परीक्षण दोबारा चलाता है, इसलिए रैंकिंग गढ़ी नहीं जा सकती।
हर निर्णय भेजा गया प्रॉम्प्ट, कच्चा उत्तर और वह मेल खाता पाठ दिखाता है जिसने उसे ट्रिगर किया। कुछ भी छिपाया नहीं जाता।
- संस्करण की अस्पष्टता एक असली मॉडल विक्रेता और स्तर की पुष्टि करता है पर अक्सर अपने सटीक संस्करण के बारे में अनिश्चित रहता है। यह अकेले कभी विफलता नहीं है, केवल सूचनात्मक रूप में चिह्नित किया जाता है।
- अस्थायी त्रुटियाँ दर सीमाएँ (429), 5xx और टाइमआउट किसी रन को असत्यापित के रूप में चिह्नित करते हैं, कभी संदिग्ध के रूप में नहीं। बुरे क्षण से गुज़र रहे असली एंडपॉइंट को दंडित नहीं किया जाता।
- क्लाउड होस्ट नाम होस्ट के रूप में AWS Bedrock, Google Vertex या Azure का नाम लेना स्वीकार्य है, क्योंकि ये असली मॉडल को पुनः बेचने के वैध तरीके हैं।
- प्रोटोकॉल पुनराकार chat-completions और मूल messages प्रारूप के बीच अनुवाद करना सामान्य गेटवे व्यवहार है और जब मॉडल स्वयं असली हो तो यह धोखाधड़ी का संकेत नहीं है।
- एक डगमगाता प्रोब चार में से तीन प्रोब पास होना असली माने जाने के लिए पर्याप्त है, इसलिए एक अकेला बेढंगा उत्तर किसी ईमानदार एंडपॉइंट को दोषी नहीं ठहराता।
यह पूरा परीक्षक ओपन सोर्स है। ठीक-ठीक पढ़ें कि कौन-कौन से प्रोब चलते हैं और क्यों: डिटेक्शन कोड देखें
बेहतर प्रोब के लिए कोई विचार है? इसे यहाँ सुझाएँ:GitHub issue खोलेंDiscord पर रिपोर्ट करें
ओपन सोर्स। इसे सत्यापित करें और सुधारें।
परीक्षण कोड खुला है। देखें कि कौन सी जांच क्यों चलती हैं, नई जांच सुझाएं, या हमारे Discord पर पहचान पर चर्चा करें।