ドキュメントを検索...

入力してドキュメントを検索

プラットフォームガイド

モデルと料金

:free サフィックスの意味、使用量の課金方法、モデルが時々消える理由。

カタログ

モデルページは、各モデルをコンテキストウィンドウ、トークン単位の料金、対応エンドポイント、ツール呼び出しや画像入力といった機能フィルターとともに一覧表示します。各モデルにはコピー&ペーストできるコード例を備えた専用ページがあります。すべての無料モデルがツール呼び出しやビジョンに対応しているわけではないので、コーディングエージェントに組み込む前に機能バッジを確認してください。

ランキングは、コミュニティのテスト結果に基づいて、どの無料モデルが実際に使えるかを示します。ステータスはプロバイダーの稼働状況をライブで追跡します。

無料モデルと有料モデル

無料モデルには :free サフィックスが付きます。例えば gpt-oss-120b:free

:free モデルは無料の上流プロバイダーにのみルーティングされ、残高には一切触れません。サフィックスなしの同じベース名は有料版です:安定していて上限がなく、トークン単位で課金されます。両者は並存できるため、無料から有料への切り替えは 1 つの文字列の変更で済みます。

無料モデルが無料なのには理由があります。レート制限を決めるのは上流プロバイダーであって、私たちではありません。ピーク時には 429 応答を想定し、信頼性が必要なときは有料モデルを使ってください。

料金の仕組み

ほとんどのモデルはトークン単位で課金し、入力と出力に別々の料金があります。一部のモデル(主に画像と動画)は、代わりに呼び出しごとの定額料金で課金します。モデルページに表示されるものがそのまま支払額です:サブスクリプションも隠れた料金もなく、残高はリクエストごとに減るだけです。

料金ページには現在のチャージオプションがあり、各モデルページはトークン単位のライブ料金を表示します。

プロンプトキャッシュ

プロンプトキャッシュに対応するモデル(Claude など)では、繰り返されるプロンプトのプレフィックスは割引されたキャッシュ入力レートで課金され、一方で新しいキャッシュエントリの書き込みは通常の入力トークンよりわずかに高くなります(約 1.25 倍)。

キャッシュは自動です。長く安定したシステムプロンプトを持つワークロード(エージェント、RP プリセット)が最も恩恵を受け、設定は不要です。

提供状況とフェイルオーバー

無料モデルに複数の上流プロバイダーがある場合、あるプロバイダーがレート制限に達すると、リクエストは自動的に次のプロバイダーへフェイルオーバーします。単一プロバイダーのモデルはフェイルオーバーできないため、制限がリセットされるまで停滞します。

各モデルは1つ以上のプロバイダーチャネルを通じて動作します。レート制限に達したチャネルは一時的に無効化されて非表示になり、回復するまで選択肢として表示されません。1つでもチャネルが稼働している限り、モデルはそのチャネルを通じて動作し続けます。あるモデルのすべてのチャネルがレート制限された場合にのみ、モデル自体がカタログから消えます。

負荷がかかっているときにモデルがリストから消えるのは想定内であり、誤字でも障害でもありません。チャネルがヘルスチェックに合格すれば、通常は数分以内に自動的に再表示されます。保存したモデル名が解決されなくなった場合は、モデルページを確認してください。回復中か、名前が変更されたかのいずれかです。

モデルと料金の解説