Disponível agora
NVIDIA

nemotron-3-ultra-550b-a55b

NVIDIA Nemotron 3 Ultra is an open frontier-reasoning and orchestration model from NVIDIA, with 55B active parameters out of 550B total (MoE). Built on a hybrid Transformer-Mamba mixture-of-experts architecture, it...

TextReasoningToolsOpen Weights1MCache262.1K
EntradaGrátis
SaídaGrátis
Contexto262.1K
Endpointsopenai

Capacidades

RaciocínioFerramentasCacheEstruturado

Modalidades

Entrada
text
Saída
text

Estatísticas rápidas

Janela de contexto262.1K
Saída máxima16.4K
TokenizadorOther
Quantizaçãobf16

Desempenho

Carregando dados de desempenho...

Parâmetros suportados

ParâmetroSemprePadrão
frequency_penalty(não enviar)
include_reasoning-
logit_bias-
max_tokens-
min_p-
presence_penalty(não enviar)
reasoning-
repetition_penalty(não enviar)
response_format-
seed-
stop-
structured_outputs-
temperature1
tool_choice-
tools-
top_k(não enviar)
top_p0.95
§ 01

Preços

Preço de entrada$0.00 · 1M tokens
Preço de saída$0.00 · 1M tokens
Janela de contexto262.1K tokens
Endpoints compatíveisopenai
FornecedorNVIDIA
§ 02

Chamar nemotron-3-ultra-550b-a55b do seu código

Aponte qualquer SDK compatível com OpenAI para UnoRouter e solicite o modelo pelo nome. Substitua YOUR_API_KEY por uma chave real do seu painel.

bash
curl https://api.unorouter.com/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "nemotron-3-ultra-550b-a55b",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

Entre para preencher automaticamente sua chave API

§ 03

Perguntas frequentes

Quanto custa nemotron-3-ultra-550b-a55b por 1M tokens?

A entrada custa $0.00 por 1M tokens, a saída $0.00 por 1M tokens. A cobrança é por token, sem arredondamento para tamanhos de lote.

Como acesso nemotron-3-ultra-550b-a55b via API?

Envie solicitações ao endpoint /v1/chat/completions de UnoRouter com model=nemotron-3-ultra-550b-a55b. Qualquer biblioteca cliente compatível com OpenAI funciona. A autenticação usa um token Bearer padrão.

Qual é a janela de contexto de nemotron-3-ultra-550b-a55b?

nemotron-3-ultra-550b-a55b suporta uma janela de contexto de 262.1K tokens, compartilhada entre seu prompt e a resposta do modelo.

§ 04

Modelos similares

Experimente nemotron-3-ultra-550b-a55b agora

Crie uma chave API e comece a fazer solicitações em menos de um minuto.

Ver todos os modelos