Модели и цены
Что означает суффикс :free, как тарифицируется использование и почему модель иногда исчезает.
Каталог
Страница Модели перечисляет каждую модель с контекстным окном, потокенными ценами, поддерживаемыми эндпоинтами и фильтрами возможностей, такими как вызов инструментов и ввод изображений. У каждой модели своя страница с готовыми к копированию примерами кода. Не каждая бесплатная модель поддерживает вызов инструментов или зрение, поэтому проверяйте бейджи возможностей, прежде чем подключать её к кодинг-агенту.
Рейтинги показывают, какие бесплатные модели действительно справляются, на основе результатов тестов сообщества. Статус отслеживает состояние провайдеров в реальном времени.
Бесплатные и платные модели
Бесплатные модели несут суффикс :free, например gpt-oss-120b:free
Модель :free маршрутизируется только к бесплатным upstream-провайдерам и никогда не затрагивает ваш баланс. То же базовое имя без суффикса это платная версия: стабильная, без ограничений и с потокенной оплатой. Обе могут существовать бок о бок, поэтому переход с бесплатной на платную это изменение одной строки.
Бесплатные модели бесплатны не просто так: лимиты запросов задают upstream-провайдеры, а не мы. Ожидайте ответов 429 в часы пик и используйте платную модель, когда нужна надёжность.
Как работает тарификация
Большинство моделей тарифицируется потокенно, с раздельными ценами на ввод и вывод. Несколько моделей (в основном изображения и видео) вместо этого берут фиксированную цену за вызов. То, что вы видите на странице модели, это то, что вы платите: без подписок, без скрытых комиссий, ваш баланс просто уменьшается с каждым запросом.
На странице Цены есть текущие варианты пополнения; каждая страница модели показывает актуальные потокенные цены.
Кэширование промптов
Для моделей, поддерживающих кэширование промптов (Claude и другие), повторяющиеся префиксы промптов тарифицируются по сниженной ставке за кэшированный ввод, тогда как запись новой записи в кэш стоит немного дороже обычного входного токена (примерно 1,25x).
Кэширование происходит автоматически. Больше всего выигрывают нагрузки с длинными и стабильными системными промптами (агенты, RP-пресеты), никакой настройки не требуется.
Доступность и переключение
Когда у бесплатной модели несколько upstream-провайдеров, запросы автоматически переключаются на следующий, если провайдер достигает своего лимита запросов. Модели с одним провайдером не могут переключаться, поэтому они простаивают до сброса лимита.
Каждая модель работает через один или несколько каналов провайдера. Канал, упёршийся в свой лимит запросов, временно отключается и скрывается, он не показывается как вариант, пока восстанавливается. Пока работает хотя бы один канал, модель продолжает работать через него. Только когда все каналы модели упёрлись в лимит запросов, сама модель исчезает из каталога.
Исчезновение модели из списка ожидаемо при нагрузке, это не опечатка и не сбой. Она появляется снова сама, как только канал проходит проверку состояния, обычно в течение нескольких минут. Если сохранённое имя модели перестаёт разрешаться, проверьте страницу Модели: она либо восстанавливается, либо была переименована.