Disponible ahora
NVIDIA

llama-3.3-nemotron-super-49b-v1

Llama-3.3-Nemotron-Super-49B-v1.5 is a 49B-parameter, English-centric reasoning/chat model derived from Meta’s Llama-3.3-70B-Instruct with a 128K context. It’s post-trained for agentic workflows (RAG, tool calling) via SFT across math, code, science, and...

Text128KReasoningTools131.1K
EntradaGratis
SalidaGratis
Contexto128K
Endpointsopenai

Capacidades

RazonamientoHerramientasEstructurado

Modalidades

Entrada
text
Salida
text

Estadísticas rápidas

Ventana de contexto131.1K
Salida máxima131.1K
Modochat
TokenizadorLlama3
Corte de conocimiento2024
Cuantizaciónfp8

Rendimiento

Cargando datos de rendimiento...

Parámetros compatibles

ParámetroSiemprePredeterminado
frequency_penalty(no enviar)
include_reasoning-
logit_bias-
max_tokens-
min_p-
presence_penalty(no enviar)
reasoning-
repetition_penalty(no enviar)
response_format-
seed-
stop-
temperature0.6
tool_choice-
tools-
top_k(no enviar)
top_p0.95
§ 01

Precios

Precio de entrada$0.00 · 1M tokens
Precio de salida$0.00 · 1M tokens
Ventana de contexto128K tokens
Endpoints compatiblesopenai
ProveedorNVIDIA
§ 02

Llamar a llama-3.3-nemotron-super-49b-v1 desde tu código

Apunta cualquier SDK compatible con OpenAI a UnoRouter y solicita el modelo por nombre. Reemplaza YOUR_API_KEY con una clave real de tu panel.

bash
curl https://api.unorouter.com/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "llama-3.3-nemotron-super-49b-v1",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

Inicia sesión para autocompletar tu clave API

§ 03

Preguntas frecuentes

¿Cuánto cuesta llama-3.3-nemotron-super-49b-v1 por 1M tokens?

La entrada se cobra a $0.00 por 1M tokens, la salida a $0.00 por 1M tokens. La facturación es por token, sin redondeo a tamaños de lote.

¿Cómo accedo a llama-3.3-nemotron-super-49b-v1 vía API?

Envía solicitudes al endpoint /v1/chat/completions de UnoRouter con model=llama-3.3-nemotron-super-49b-v1. Cualquier biblioteca cliente compatible con OpenAI funciona. La autenticación usa un token Bearer estándar.

¿Cuál es la ventana de contexto de llama-3.3-nemotron-super-49b-v1?

llama-3.3-nemotron-super-49b-v1 soporta una ventana de contexto de 128K tokens, compartida entre tu prompt y la respuesta del modelo.

§ 04

Modelos similares

Prueba llama-3.3-nemotron-super-49b-v1 ahora

Crea una clave API y empieza a hacer solicitudes en menos de un minuto.

Ver todos los modelos