지금 사용 가능
NVIDIA

nemotron-3-ultra-550b-a55b

NVIDIA Nemotron 3 Ultra is an open frontier-reasoning and orchestration model from NVIDIA, with 55B active parameters out of 550B total (MoE). Built on a hybrid Transformer-Mamba mixture-of-experts architecture, it...

TextReasoningToolsOpen Weights1MCache262.1K
입력무료
출력무료
컨텍스트262.1K
엔드포인트openai

기능

추론도구캐시구조화

모달리티

입력
text
출력
text

빠른 통계

컨텍스트 윈도우262.1K
최대 출력16.4K
토크나이저Other
양자화bf16

성능

성능 데이터 로딩 중...

지원 파라미터

파라미터항상기본값
frequency_penalty(보내지 않음)
include_reasoning-
logit_bias-
max_tokens-
min_p-
presence_penalty(보내지 않음)
reasoning-
repetition_penalty(보내지 않음)
response_format-
seed-
stop-
structured_outputs-
temperature1
tool_choice-
tools-
top_k(보내지 않음)
top_p0.95
§ 01

요금

입력 가격$0.00 · 100만 토큰
출력 가격$0.00 · 100만 토큰
컨텍스트 윈도우262.1K 토큰
호환 엔드포인트openai
공급자NVIDIA
§ 02

코드에서 nemotron-3-ultra-550b-a55b 호출

OpenAI 호환 SDK를 UnoRouter으로 향하게 하고 이름으로 모델을 요청하세요. YOUR_API_KEY를 대시보드의 실제 키로 교체하세요.

bash
curl https://api.unorouter.com/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "nemotron-3-ultra-550b-a55b",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

API 키를 자동 입력하려면 로그인하세요

§ 03

자주 묻는 질문

nemotron-3-ultra-550b-a55b은 100만 토큰당 얼마인가요?

입력은 100만 토큰당 $0.00, 출력은 100만 토큰당 $0.00입니다. 청구는 토큰 단위이며 배치 크기로 반올림하지 않습니다.

API를 통해 nemotron-3-ultra-550b-a55b에 어떻게 액세스하나요?

model=nemotron-3-ultra-550b-a55b으로 UnoRouter /v1/chat/completions 엔드포인트에 요청을 보내세요. OpenAI 호환 클라이언트 라이브러리가 작동합니다. 인증은 표준 Bearer 토큰을 사용합니다.

nemotron-3-ultra-550b-a55b의 컨텍스트 윈도우는 무엇인가요?

nemotron-3-ultra-550b-a55b은 프롬프트와 모델 응답 간에 공유되는 262.1K 토큰의 컨텍스트 윈도우를 지원합니다.

§ 04

유사 모델

지금 nemotron-3-ultra-550b-a55b을 시도하세요

API 키를 만들고 1분도 안 되어 요청을 시작하세요.

모든 모델 보기