تحقق قبل أن تثق
فاحص نماذج واجهة الذكاء الاصطناعي
تحقق مما اذا كانت نقطة النهاية تقدم النموذج الحقيقي الذي تدعيه. يعمل في متصفحك، لا يتم ارسال مفتاحك الى خوادمنا.
تُعاد كل نتيجة منشورة على خادمنا قبل احتسابها، ويربط كل حكم بالدليل الدقيق الذي أنتجه. ويمكن الاعتراض على أي نتيجة تعتقد أنها خاطئة.أبلِغ على Discordافتح مشكلة على GitHub
لماذا يختلف هذا المختبِر
كل فحص يطابق إشارة محددة في الرد، لذا لا نُعلِّم النماذج الحقيقية كمزيّفة كما تفعل البصمة الإحصائية. اقرأ الشيفرة الدقيقة.
لا تصل النتيجة إلى اللوحة العامة إلا بعد أن يعيد خادمنا تشغيل الاختبار كاملًا بنفسه، فلا يمكن تزوير الترتيب.
يُظهر كل حكم الطلب المرسَل والرد الخام والنص المطابق الذي تسبّب فيه. لا شيء مخفيّ.
- غموض النسخة يؤكّد النموذج الحقيقي المزوّد والفئة لكنه غالبًا غير متأكد من نسخته الدقيقة. هذا وحده لا يُعدّ فشلًا أبدًا، بل يُعلَّم كملاحظة إرشادية فقط.
- أخطاء مؤقتة حدود المعدّل (429) وأخطاء 5xx والمهلات تُعلِّم التشغيل بأنه غير مُتحقَّق منه، لا مشبوهًا أبدًا. لا يُعاقَب نقطة نهاية حقيقية تمرّ بلحظة سيئة.
- أسماء مستضيفات سحابية تسمية AWS Bedrock أو Google Vertex أو Azure كمستضيف أمر مقبول، فهي طرق مشروعة لإعادة بيع النموذج الحقيقي.
- إعادة تشكيل البروتوكول الترجمة بين chat-completions وصيغة messages الأصلية سلوك بوابة عادي وليست إشارة احتيال ما دام النموذج نفسه حقيقيًا.
- مسبار واحد غير مستقر نجاح ثلاثة مسابر من أربعة يكفي للاعتبار حقيقيًا، فإجابة واحدة شاذة لا تُدين نقطة نهاية صادقة.
هذا الفاحص بالكامل مفتوح المصدر. اقرأ بالضبط أي اختبارات تُجرى ولماذا: عرض كود الكشف
لديك فكرة لاختبار أفضل؟ اقترحها هنا:افتح مشكلة على GitHubأبلِغ على Discord
مفتوح المصدر. تحقق منه وحسنه.
كود الاختبار مفتوح. شاهد بالضبط اي الفحوصات تعمل ولماذا، اقترح اختبارات جديدة، او ناقش الكشف على Discord الخاص بنا.