Modeller ve Fiyatlandırma
:free son ekinin ne anlama geldiği, kullanımın nasıl fiyatlandırıldığı ve bir modelin neden bazen kaybolduğu.
Katalog
Modeller sayfası her modeli bağlam penceresi, token başına fiyatlar, desteklenen uç noktalar ve araç çağırma ile görüntü girişi gibi yetenek filtreleriyle listeler. Her modelin kopyala-yapıştır kod örnekleri içeren kendi sayfası vardır. Her ücretsiz model araç çağrılarını veya görme yeteneğini desteklemez, bu yüzden birini bir kodlama ajanına bağlamadan önce yetenek rozetlerini kontrol edin.
Sıralamalar, topluluk test sonuçlarına dayanarak hangi ücretsiz modellerin gerçekten iş gördüğünü gösterir. Durum, sağlayıcı durumunu canlı olarak izler.
Ücretsiz ve ücretli modeller
Ücretsiz modeller bir :free son eki taşır, örneğin gpt-oss-120b:free
Bir :free modeli yalnızca ücretsiz upstream sağlayıcılara yönlendirilir ve bakiyenize asla dokunmaz. Son eki olmayan aynı temel ad ücretli sürümdür: kararlı, sınırsız ve token başına faturalandırılan. İkisi yan yana var olabilir, dolayısıyla ücretsizden ücretliye geçmek tek bir dize değişikliğidir.
Ücretsiz modeller bir nedenden dolayı ücretsizdir: hız sınırlarını biz değil, upstream sağlayıcılar belirler. Yoğun saatlerde 429 yanıtları bekleyin ve güvenilirliğe ihtiyacınız olduğunda ücretli bir model kullanın.
Fiyatlandırma nasıl çalışır
Modellerin çoğu, ayrı girdi ve çıktı fiyatlarıyla token başına faturalandırır. Birkaç model (çoğunlukla görüntü ve video) bunun yerine çağrı başına sabit bir fiyat uygular. Model sayfasında gördüğünüz, ödediğiniz şeydir: abonelik yok, gizli ücret yok, bakiyeniz her istekte sadece azalır.
Fiyatlandırma sayfası mevcut yükleme seçeneklerini içerir; her model sayfası token başına canlı fiyatları gösterir.
Prompt önbelleği
Prompt önbelleğini destekleyen modellerde (Claude ve diğerleri), tekrar eden prompt önekleri düşük bir önbelleğe alınmış girdi ücretiyle faturalandırılır; yeni bir önbellek girişi yazmak ise normal bir girdi tokeninden biraz daha pahalıdır (yaklaşık 1,25x).
Önbellekleme otomatiktir. Uzun ve kararlı sistem promptlarına sahip iş yükleri (ajanlar, RP ön ayarları) hiçbir yapılandırma gerektirmeden en çok fayda sağlar.
Kullanılabilirlik ve yük devretme
Bir ücretsiz modelin birden fazla upstream sağlayıcısı olduğunda, bir sağlayıcı hız sınırına ulaşırsa istekler otomatik olarak bir sonrakine devreder. Tek sağlayıcılı modeller devredemez, bu yüzden sınır sıfırlanana kadar takılı kalırlar.
Her model bir veya daha fazla sağlayıcı kanalı üzerinden çalışır. Hız sınırına ulaşan bir kanal geçici olarak devre dışı bırakılıp gizlenir, toparlanana kadar seçenek olarak gösterilmez. En az bir kanal hâlâ ayaktayken model onun üzerinden çalışmaya devam eder. Yalnızca bir modelin tüm kanalları hız sınırına takıldığında modelin kendisi katalogdan kaybolur.
Bir modelin listeden kaybolması yük altında beklenen bir durumdur, yazım hatası ya da kesinti değildir. Bir kanal durum kontrolünü geçer geçmez model kendiliğinden geri gelir, genellikle birkaç dakika içinde. Kaydedilmiş bir model adı çözümlenmeyi durdurursa Modeller sayfasını kontrol edin: model ya toparlanıyordur ya da yeniden adlandırılmıştır.