Xac minh truoc khi tin tuong
Trinh kiem tra mo hinh API AI
Kiem tra xem mot diem cuoi co cung cap dung mo hinh ma no tuyen bo khong. Chay trong trinh duyet, khoa cua ban khong duoc gui den may chu cua chung toi.
Mọi kết quả đã công bố đều được chạy lại trên máy chủ của chúng tôi trước khi được tính, và mỗi phán quyết đều liên kết tới bằng chứng chính xác đã tạo ra nó. Một kết quả mà bạn cho là sai có thể được khiếu nại.Báo cáo trên DiscordMở một issue trên GitHub
Vì sao trình kiểm tra này khác biệt
Mỗi lần kiểm tra đều khớp với một tín hiệu cụ thể trong câu trả lời, nên chúng tôi không gắn cờ các mô hình thật là giả theo cách mà việc lấy dấu vân tay thống kê làm. Hãy đọc mã chính xác.
Một kết quả chỉ lên bảng công khai sau khi máy chủ của chúng tôi tự chạy lại toàn bộ bài kiểm tra, nên các bảng xếp hạng không thể bị làm giả.
Mỗi phán quyết đều cho thấy lời nhắc đã gửi, câu trả lời thô và đoạn văn bản khớp đã kích hoạt nó. Không có gì bị che giấu.
- Mơ hồ về phiên bản một mô hình chính hãng xác nhận nhà cung cấp và cấp bậc nhưng thường không chắc về phiên bản chính xác. Riêng điều đó không bao giờ là một lần thất bại, chỉ được đánh dấu mang tính tham khảo.
- Lỗi tạm thời giới hạn tốc độ (429), lỗi 5xx và hết thời gian chờ đánh dấu một lần chạy là chưa xác minh, không bao giờ là đáng ngờ. Một điểm cuối thật đang gặp một khoảnh khắc tồi tệ sẽ không bị phạt.
- Tên máy chủ đám mây việc nêu AWS Bedrock, Google Vertex hoặc Azure làm máy chủ được chấp nhận, vì đó là những cách hợp lệ để bán lại mô hình thật.
- Định hình lại giao thức việc chuyển đổi giữa chat-completions và định dạng messages gốc là hành vi cổng kết nối bình thường và không phải tín hiệu gian lận khi bản thân mô hình là chính hãng.
- Một lượt thăm dò chập chờn ba trong bốn lượt thăm dò đạt là đủ để được xem là chính hãng, nên một câu trả lời lệch lạc đơn lẻ không kết tội một điểm cuối trung thực.
Toàn bộ công cụ kiểm tra này là mã nguồn mở. Đọc chính xác phép thử nào chạy và vì sao: Xem mã phát hiện
Có ý tưởng cho một phép thử tốt hơn? Đề xuất tại đây:Mở một issue trên GitHubBáo cáo trên Discord
Ma nguon mo. Hay xac minh va cai thien.
Ma kiem tra duoc cong khai. Xem chinh xac tham do nao chay va tai sao, de xuat bai kiem tra moi, hoac thao luan ve phat hien tren Discord cua chung toi.