llama-3.3-nemotron-super-49b-v1.5

Name: llama-3.3-nemotron-super-49b-v1.5
Brand: NVIDIA

Llama-3.3-Nemotron-Super-49B-v1.5 is a 49B-parameter, English-centric reasoning/chat model derived from Meta’s Llama-3.3-70B-Instruct with a 128K context. It’s post-trained for agentic workflows (RAG, tool calling) via SFT across math, code, science, and...

TextReasoningTools131.1K

EntradaGrátis

SaídaGrátis

Contexto131.1K

Endpointsopenai

Capacidades

RaciocínioFerramentasEstruturado

Modalidades

Entrada

text

Saída

text

Estatísticas rápidas

Janela de contexto131.1K

Saída máxima131.1K

Modochat

TokenizadorLlama3

Corte de conhecimento2024

Quantizaçãofp8

Hugging Facenvidia/Llama-3_3-Nemotron-Super-49B-v1_5

Desempenho

Carregando dados de desempenho...

Parâmetros suportados

Parâmetro	Sempre	Padrão
frequency_penalty		(não enviar)
include_reasoning		-
logit_bias		-
max_tokens		-
min_p		-
presence_penalty		(não enviar)
reasoning		-
repetition_penalty		(não enviar)
response_format		-
seed		-
stop		-
temperature		0.6
tool_choice		-
tools		-
top_k		(não enviar)
top_p		0.95

§ 01

Preços

Pague apenas pelo que usar. Sem mínimos mensais ao usar Pagamento por Uso.

Preço de entrada	$0.00 · 1M tokens
Preço de saída	$0.00 · 1M tokens
Janela de contexto	131.1K tokens
Endpoints compatíveis	openai
Fornecedor	NVIDIA

§ 02

Chamar llama-3.3-nemotron-super-49b-v1.5 do seu código

Aponte qualquer SDK compatível com OpenAI para UnoRouter e solicite o modelo pelo nome. Substitua YOUR_API_KEY por uma chave real do seu painel.

bash

curl https://api.unorouter.com/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "llama-3.3-nemotron-super-49b-v1.5",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

Entre para preencher automaticamente sua chave API

§ 03

Perguntas frequentes

Quanto custa llama-3.3-nemotron-super-49b-v1.5 por 1M tokens?

A entrada custa $0.00 por 1M tokens, a saída $0.00 por 1M tokens. A cobrança é por token, sem arredondamento para tamanhos de lote.

Como acesso llama-3.3-nemotron-super-49b-v1.5 via API?

Envie solicitações ao endpoint /v1/chat/completions de UnoRouter com model=llama-3.3-nemotron-super-49b-v1.5. Qualquer biblioteca cliente compatível com OpenAI funciona. A autenticação usa um token Bearer padrão.