llama-3.3-nemotron-super-49b-v1

Name: llama-3.3-nemotron-super-49b-v1
Brand: NVIDIA

Llama-3.3-Nemotron-Super-49B-v1.5 is a 49B-parameter, English-centric reasoning/chat model derived from Meta’s Llama-3.3-70B-Instruct with a 128K context. It’s post-trained for agentic workflows (RAG, tool calling) via SFT across math, code, science, and...

Text128KReasoningTools131.1K

InputGratis

OutputGratis

Contesto128K

Endpointopenai

Capacità

RagionamentoStrumentiStrutturato

Modalità

Input

text

Output

text

Statistiche rapide

Finestra di contesto131.1K

Output massimo131.1K

Modalitàchat

TokenizerLlama3

Limite di conoscenza2024

Quantizzazionefp8

Hugging Facenvidia/Llama-3_3-Nemotron-Super-49B-v1_5

Performance

Caricamento dati di performance...

Parametri supportati

Parametro	Sempre	Predefinito
frequency_penalty		(non inviare)
include_reasoning		-
logit_bias		-
max_tokens		-
min_p		-
presence_penalty		(non inviare)
reasoning		-
repetition_penalty		(non inviare)
response_format		-
seed		-
stop		-
temperature		0.6
tool_choice		-
tools		-
top_k		(non inviare)
top_p		0.95

§ 01

Prezzi

Paga solo per quello che usi. Nessun minimo mensile quando usi Pagamento a consumo.

Prezzo di input	$0.00 · 1M token
Prezzo di output	$0.00 · 1M token
Finestra di contesto	128K token
Endpoint compatibili	openai
Provider	NVIDIA

§ 02

Chiamare llama-3.3-nemotron-super-49b-v1 dal tuo codice

Punta qualsiasi SDK compatibile con OpenAI a UnoRouter e richiedi il modello per nome. Sostituisci YOUR_API_KEY con una vera chiave dal tuo dashboard.

bash

curl https://api.unorouter.com/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "llama-3.3-nemotron-super-49b-v1",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

Accedi per compilare automaticamente la tua chiave API

§ 03

Domande frequenti

Quanto costa llama-3.3-nemotron-super-49b-v1 per 1M token?

L'input ha un prezzo di $0.00 per 1M token, l'output di $0.00 per 1M token. La fatturazione è per token, nessun arrotondamento alle dimensioni del batch.

Come accedo a llama-3.3-nemotron-super-49b-v1 tramite API?

Invia richieste all'endpoint /v1/chat/completions di UnoRouter con model=llama-3.3-nemotron-super-49b-v1. Qualsiasi libreria client compatibile con OpenAI funziona. L'autenticazione usa un token Bearer standard.