Cari dokumen...

Mulai mengetik untuk mencari dokumentasi

Panduan Platform

Model & Harga

Apa arti akhiran :free, bagaimana penggunaan ditagih, dan mengapa sebuah model terkadang menghilang.

Katalog

Halaman Model mencantumkan setiap model dengan jendela konteks, harga per token, endpoint yang didukung, dan filter kemampuan seperti pemanggilan alat dan input gambar. Setiap model memiliki halamannya sendiri dengan contoh kode siap salin-tempel. Tidak setiap model gratis mendukung pemanggilan alat atau visi, jadi periksa lencana kemampuan sebelum menyambungkannya ke agen pengodean.

Peringkat menunjukkan model gratis mana yang benar-benar dapat diandalkan, berdasarkan hasil pengujian komunitas. Status melacak kesehatan penyedia secara langsung.

Model gratis vs berbayar

Model gratis membawa akhiran :free, misalnya gpt-oss-120b:free

Model :free hanya diarahkan ke penyedia upstream gratis dan tidak pernah menyentuh saldo Anda. Nama dasar yang sama tanpa akhiran adalah versi berbayar: stabil, tanpa batas, dan ditagih per token. Keduanya bisa berdampingan, jadi beralih dari gratis ke berbayar adalah perubahan satu string.

Model gratis gratis karena suatu alasan: penyedia upstream yang menetapkan batas laju, bukan kami. Harapkan respons 429 pada jam sibuk, dan gunakan model berbayar saat Anda membutuhkan keandalan.

Cara kerja harga

Sebagian besar model menagih per token, dengan harga input dan output terpisah. Beberapa model (kebanyakan gambar dan video) justru menagih harga tetap per panggilan. Apa yang Anda lihat di halaman model adalah apa yang Anda bayar: tanpa langganan, tanpa biaya tersembunyi, saldo Anda hanya berkurang per permintaan.

Halaman Harga memiliki opsi isi ulang saat ini; setiap halaman model menampilkan harga per token secara langsung.

Caching prompt

Untuk model yang mendukung caching prompt (Claude dan lainnya), prefiks prompt yang berulang ditagih dengan tarif input tercache yang lebih rendah, sementara menulis entri cache baru sedikit lebih mahal daripada token input biasa (sekitar 1,25x).

Caching bersifat otomatis. Beban kerja dengan prompt sistem yang panjang dan stabil (agen, preset RP) paling diuntungkan, tanpa perlu konfigurasi.

Ketersediaan & failover

Ketika sebuah model gratis memiliki beberapa penyedia upstream, permintaan otomatis failover ke penyedia berikutnya jika satu penyedia mencapai batas lajunya. Model penyedia tunggal tidak bisa failover, jadi tersendat sampai batasnya diatur ulang.

Setiap model berjalan melalui satu atau beberapa saluran penyedia. Saluran yang mencapai batas lajunya dinonaktifkan dan disembunyikan sementara, saluran itu tidak ditampilkan sebagai opsi selama pemulihannya. Selama satu saluran masih aktif, model tetap bekerja melaluinya. Hanya ketika setiap saluran untuk sebuah model terkena batas laju, model itu sendiri menghilang dari katalog.

Model yang lenyap dari daftar adalah hal yang wajar saat beban tinggi, bukan salah ketik atau gangguan. Model itu muncul kembali dengan sendirinya begitu sebuah saluran lolos pemeriksaan kesehatan, biasanya dalam hitungan menit. Jika nama model yang tersimpan berhenti dikenali, periksa halaman Model: model itu sedang pulih atau telah diganti namanya.

Penjelasan model & harga