मॉडल और मूल्य निर्धारण
:free प्रत्यय का क्या अर्थ है, उपयोग का मूल्य कैसे लगाया जाता है, और कभी-कभी कोई मॉडल क्यों गायब हो जाता है।
कैटलॉग
मॉडल पेज हर मॉडल को कॉन्टेक्स्ट विंडो, प्रति-टोकन मूल्य, समर्थित एंडपॉइंट और टूल कॉलिंग तथा इमेज इनपुट जैसे क्षमता फ़िल्टर के साथ सूचीबद्ध करता है। हर मॉडल का अपना पेज होता है जिसमें कॉपी-पेस्ट कोड उदाहरण होते हैं। हर मुफ़्त मॉडल टूल कॉल या विज़न का समर्थन नहीं करता, इसलिए किसी को कोडिंग एजेंट में जोड़ने से पहले क्षमता बैज जाँच लें।
रैंकिंग समुदाय परीक्षण परिणामों के आधार पर दिखाती है कि कौन-से मुफ़्त मॉडल वास्तव में काम आते हैं। स्टेटस प्रदाता स्वास्थ्य को लाइव ट्रैक करता है।
मुफ़्त बनाम भुगतान वाले मॉडल
मुफ़्त मॉडल एक :free प्रत्यय रखते हैं, उदाहरण के लिए gpt-oss-120b:free
एक :free मॉडल केवल मुफ़्त अपस्ट्रीम प्रदाताओं को रूट होता है और कभी भी आपके बैलेंस को नहीं छूता। बिना प्रत्यय वाला वही आधार नाम भुगतान वाला संस्करण है: स्थिर, बिना सीमा और प्रति-टोकन बिल किया जाने वाला। दोनों साथ-साथ मौजूद रह सकते हैं, इसलिए मुफ़्त से भुगतान पर स्विच करना एक स्ट्रिंग का बदलाव है।
मुफ़्त मॉडल एक कारण से मुफ़्त हैं: दर सीमाएँ अपस्ट्रीम प्रदाता तय करते हैं, हम नहीं। व्यस्त समय में 429 प्रतिक्रियाओं की अपेक्षा करें, और जब आपको विश्वसनीयता चाहिए तो भुगतान वाला मॉडल उपयोग करें।
मूल्य निर्धारण कैसे काम करता है
अधिकांश मॉडल प्रति-टोकन बिल करते हैं, जिसमें इनपुट और आउटपुट के अलग-अलग मूल्य होते हैं। कुछ मॉडल (अधिकतर इमेज और वीडियो) इसके बजाय प्रति-कॉल एक निश्चित मूल्य लेते हैं। मॉडल पेज पर आप जो देखते हैं वही आप भुगतान करते हैं: कोई सब्सक्रिप्शन नहीं, कोई छिपा शुल्क नहीं, आपका बैलेंस बस प्रति अनुरोध घटता है।
मूल्य निर्धारण पेज पर वर्तमान टॉप-अप विकल्प हैं; हर मॉडल पेज लाइव प्रति-टोकन मूल्य दिखाता है।
प्रॉम्प्ट कैशिंग
प्रॉम्प्ट कैशिंग का समर्थन करने वाले मॉडलों (Claude और अन्य) के लिए, दोहराए गए प्रॉम्प्ट उपसर्ग एक घटी हुई कैश-इनपुट दर पर बिल किए जाते हैं, जबकि एक नई कैश प्रविष्टि लिखना सामान्य इनपुट टोकन से थोड़ा महँगा होता है (लगभग 1.25 गुना)।
कैशिंग स्वचालित है। लंबे स्थिर सिस्टम प्रॉम्प्ट वाले वर्कलोड (एजेंट, RP प्रीसेट) को सबसे अधिक लाभ होता है, बिना किसी कॉन्फ़िगरेशन के।
उपलब्धता और फ़ेलओवर
जब किसी मुफ़्त मॉडल के कई अपस्ट्रीम प्रदाता होते हैं, तो यदि कोई प्रदाता अपनी दर सीमा तक पहुँचता है, तो अनुरोध स्वचालित रूप से अगले पर फ़ेलओवर हो जाते हैं। एकल-प्रदाता मॉडल फ़ेलओवर नहीं कर सकते, इसलिए वे तब तक रुके रहते हैं जब तक सीमा रीसेट न हो जाए।
हर मॉडल एक या अधिक प्रदाता चैनलों के जरिए चलता है। जो चैनल अपनी दर-सीमा तक पहुँच जाता है उसे अस्थायी रूप से अक्षम करके छिपा दिया जाता है, और उसके उबरने के दौरान उसे विकल्प के रूप में नहीं दिखाया जाता। जब तक एक चैनल भी चालू है, मॉडल उसी के जरिए काम करता रहता है। केवल जब किसी मॉडल के सभी चैनल दर-सीमित हो जाते हैं, तभी मॉडल स्वयं कैटलॉग से गायब होता है।
भार के दौरान किसी मॉडल का सूची से गायब होना अपेक्षित है, यह कोई टाइपो या आउटेज नहीं है। जैसे ही कोई चैनल स्वास्थ्य जाँच पास करता है, यह अपने आप फिर प्रकट हो जाता है, आमतौर पर कुछ ही मिनटों में। यदि कोई सहेजा गया मॉडल नाम रिज़ॉल्व होना बंद कर दे, तो मॉडल पेज जाँचें: वह या तो उबर रहा है या उसका नाम बदल दिया गया है।