모델 및 가격
:free 접미사의 의미, 사용량 과금 방식, 그리고 모델이 때때로 사라지는 이유.
카탈로그
모델 페이지는 각 모델을 컨텍스트 윈도, 토큰당 가격, 지원 엔드포인트, 도구 호출 및 이미지 입력 같은 기능 필터와 함께 나열합니다. 각 모델에는 복사-붙여넣기용 코드 예제가 있는 전용 페이지가 있습니다. 모든 무료 모델이 도구 호출이나 비전을 지원하는 것은 아니므로, 코딩 에이전트에 연결하기 전에 기능 배지를 확인하세요.
순위는 커뮤니티 테스트 결과를 바탕으로 어떤 무료 모델이 실제로 제 역할을 하는지 보여줍니다. 상태는 제공업체 상태를 실시간으로 추적합니다.
무료 모델과 유료 모델
무료 모델에는 :free 접미사가 붙습니다. 예를 들어 gpt-oss-120b:free
:free 모델은 무료 업스트림 제공업체로만 라우팅되며 잔액에 절대 손대지 않습니다. 접미사 없는 동일한 기본 이름은 유료 버전입니다. 안정적이고 상한이 없으며 토큰당 청구됩니다. 두 가지가 나란히 존재할 수 있으므로 무료에서 유료로 전환하는 것은 문자열 하나만 바꾸면 됩니다.
무료 모델이 무료인 데는 이유가 있습니다. 속도 제한은 우리가 아니라 업스트림 제공업체가 정합니다. 피크 시간대에는 429 응답을 예상하고, 신뢰성이 필요할 때는 유료 모델을 사용하세요.
가격이 작동하는 방식
대부분의 모델은 입력과 출력에 별도의 가격을 두고 토큰당 청구합니다. 일부 모델(주로 이미지와 동영상)은 대신 호출당 정액 요금으로 청구합니다. 모델 페이지에 표시된 것이 지불 금액입니다. 구독도 숨은 요금도 없으며 잔액은 요청마다 줄어들 뿐입니다.
가격 페이지에는 현재 충전 옵션이 있으며, 각 모델 페이지는 실시간 토큰당 가격을 표시합니다.
프롬프트 캐싱
프롬프트 캐싱을 지원하는 모델(Claude 등)에서는 반복되는 프롬프트 접두부가 할인된 캐시 입력 요율로 청구되며, 새 캐시 항목을 쓰는 것은 일반 입력 토큰보다 약간 더 비쌉니다(약 1.25배).
캐싱은 자동입니다. 길고 안정적인 시스템 프롬프트를 가진 워크로드(에이전트, RP 프리셋)가 별도 설정 없이 가장 큰 이득을 봅니다.
가용성 및 장애 조치
무료 모델에 여러 업스트림 제공업체가 있으면, 한 제공업체가 속도 제한에 도달했을 때 요청이 자동으로 다음 제공업체로 장애 조치됩니다. 단일 제공업체 모델은 장애 조치를 할 수 없으므로 제한이 초기화될 때까지 멈춥니다.
각 모델은 하나 이상의 제공업체 채널을 통해 동작합니다. 속도 제한에 도달한 채널은 일시적으로 비활성화되어 숨겨지며, 회복되는 동안에는 선택지로 표시되지 않습니다. 채널이 하나라도 살아 있는 한 모델은 그 채널을 통해 계속 동작합니다. 한 모델의 모든 채널이 속도 제한에 걸렸을 때만 모델 자체가 카탈로그에서 사라집니다.
부하가 걸릴 때 모델이 목록에서 사라지는 것은 예상된 동작이며, 오타나 장애가 아닙니다. 채널이 상태 확인을 통과하면 보통 몇 분 안에 저절로 다시 나타납니다. 저장한 모델 이름이 더 이상 해석되지 않으면 모델 페이지를 확인하세요. 회복 중이거나 이름이 변경된 것입니다.