Поиск по документации...

Начните вводить, чтобы искать по документации

Руководство по платформе

Модели и цены

Что означает суффикс :free, как тарифицируется использование и почему модель иногда исчезает.

Каталог

Страница Модели перечисляет каждую модель с контекстным окном, потокенными ценами, поддерживаемыми эндпоинтами и фильтрами возможностей, такими как вызов инструментов и ввод изображений. У каждой модели своя страница с готовыми к копированию примерами кода. Не каждая бесплатная модель поддерживает вызов инструментов или зрение, поэтому проверяйте бейджи возможностей, прежде чем подключать её к кодинг-агенту.

Рейтинги показывают, какие бесплатные модели действительно справляются, на основе результатов тестов сообщества. Статус отслеживает состояние провайдеров в реальном времени.

Бесплатные и платные модели

Бесплатные модели несут суффикс :free, например gpt-oss-120b:free

Модель :free маршрутизируется только к бесплатным upstream-провайдерам и никогда не затрагивает ваш баланс. То же базовое имя без суффикса это платная версия: стабильная, без ограничений и с потокенной оплатой. Обе могут существовать бок о бок, поэтому переход с бесплатной на платную это изменение одной строки.

Бесплатные модели бесплатны не просто так: лимиты запросов задают upstream-провайдеры, а не мы. Ожидайте ответов 429 в часы пик и используйте платную модель, когда нужна надёжность.

Как работает тарификация

Большинство моделей тарифицируется потокенно, с раздельными ценами на ввод и вывод. Несколько моделей (в основном изображения и видео) вместо этого берут фиксированную цену за вызов. То, что вы видите на странице модели, это то, что вы платите: без подписок, без скрытых комиссий, ваш баланс просто уменьшается с каждым запросом.

На странице Цены есть текущие варианты пополнения; каждая страница модели показывает актуальные потокенные цены.

Кэширование промптов

Для моделей, поддерживающих кэширование промптов (Claude и другие), повторяющиеся префиксы промптов тарифицируются по сниженной ставке за кэшированный ввод, тогда как запись новой записи в кэш стоит немного дороже обычного входного токена (примерно 1,25x).

Кэширование происходит автоматически. Больше всего выигрывают нагрузки с длинными и стабильными системными промптами (агенты, RP-пресеты), никакой настройки не требуется.

Доступность и переключение

Когда у бесплатной модели несколько upstream-провайдеров, запросы автоматически переключаются на следующий, если провайдер достигает своего лимита запросов. Модели с одним провайдером не могут переключаться, поэтому они простаивают до сброса лимита.

Каждая модель работает через один или несколько каналов провайдера. Канал, упёршийся в свой лимит запросов, временно отключается и скрывается, он не показывается как вариант, пока восстанавливается. Пока работает хотя бы один канал, модель продолжает работать через него. Только когда все каналы модели упёрлись в лимит запросов, сама модель исчезает из каталога.

Исчезновение модели из списка ожидаемо при нагрузке, это не опечатка и не сбой. Она появляется снова сама, как только канал проходит проверку состояния, обычно в течение нескольких минут. Если сохранённое имя модели перестаёт разрешаться, проверьте страницу Модели: она либо восстанавливается, либо была переименована.

Модели и цены: пояснения