llama-3.3-nemotron-super-49b-v1

Name: llama-3.3-nemotron-super-49b-v1
Brand: NVIDIA

Llama-3.3-Nemotron-Super-49B-v1.5 is a 49B-parameter, English-centric reasoning/chat model derived from Meta’s Llama-3.3-70B-Instruct with a 128K context. It’s post-trained for agentic workflows (RAG, tool calling) via SFT across math, code, science, and...

Text128KReasoningTools131.1K

EntradaGratis

SalidaGratis

Contexto128K

Endpointsopenai

Capacidades

RazonamientoHerramientasEstructurado

Modalidades

Entrada

text

Salida

text

Estadísticas rápidas

Ventana de contexto131.1K

Salida máxima131.1K

Modochat

TokenizadorLlama3

Corte de conocimiento2024

Cuantizaciónfp8

Hugging Facenvidia/Llama-3_3-Nemotron-Super-49B-v1_5

Rendimiento

Cargando datos de rendimiento...

Parámetros compatibles

Parámetro	Siempre	Predeterminado
frequency_penalty		(no enviar)
include_reasoning		-
logit_bias		-
max_tokens		-
min_p		-
presence_penalty		(no enviar)
reasoning		-
repetition_penalty		(no enviar)
response_format		-
seed		-
stop		-
temperature		0.6
tool_choice		-
tools		-
top_k		(no enviar)
top_p		0.95

§ 01

Precios

Paga solo por lo que usas. Sin mínimos mensuales al usar Pago por Uso.

Precio de entrada	$0.00 · 1M tokens
Precio de salida	$0.00 · 1M tokens
Ventana de contexto	128K tokens
Endpoints compatibles	openai
Proveedor	NVIDIA

§ 02

Llamar a llama-3.3-nemotron-super-49b-v1 desde tu código

Apunta cualquier SDK compatible con OpenAI a UnoRouter y solicita el modelo por nombre. Reemplaza YOUR_API_KEY con una clave real de tu panel.

bash

curl https://api.unorouter.com/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "llama-3.3-nemotron-super-49b-v1",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

Inicia sesión para autocompletar tu clave API

§ 03

Preguntas frecuentes

¿Cuánto cuesta llama-3.3-nemotron-super-49b-v1 por 1M tokens?

La entrada se cobra a $0.00 por 1M tokens, la salida a $0.00 por 1M tokens. La facturación es por token, sin redondeo a tamaños de lote.

¿Cómo accedo a llama-3.3-nemotron-super-49b-v1 vía API?

Envía solicitudes al endpoint /v1/chat/completions de UnoRouter con model=llama-3.3-nemotron-super-49b-v1. Cualquier biblioteca cliente compatible con OpenAI funciona. La autenticación usa un token Bearer estándar.