llama-3.3-nemotron-super-49b-v1.5

Name: llama-3.3-nemotron-super-49b-v1.5
Brand: NVIDIA

Llama-3.3-Nemotron-Super-49B-v1.5 is a 49B-parameter, English-centric reasoning/chat model derived from Meta’s Llama-3.3-70B-Instruct with a 128K context. It’s post-trained for agentic workflows (RAG, tool calling) via SFT across math, code, science, and...

TextReasoningTools131.1K

EntréeGratuit

SortieGratuit

Contexte131.1K

Points d'accèsopenai

Capacités

RaisonnementOutilsStructuré

Modalités

Entrée

text

Sortie

text

Statistiques rapides

Fenêtre de contexte131.1K

Sortie max131.1K

Modechat

TokenizerLlama3

Date de connaissance2024

Quantificationfp8

Hugging Facenvidia/Llama-3_3-Nemotron-Super-49B-v1_5

Performance

Chargement des performances...

Paramètres supportés

Paramètre	Toujours	Par défaut
frequency_penalty		(ne pas envoyer)
include_reasoning		-
logit_bias		-
max_tokens		-
min_p		-
presence_penalty		(ne pas envoyer)
reasoning		-
repetition_penalty		(ne pas envoyer)
response_format		-
seed		-
stop		-
temperature		0.6
tool_choice		-
tools		-
top_k		(ne pas envoyer)
top_p		0.95

§ 01

Tarification

Payez uniquement ce que vous utilisez. Aucun minimum mensuel avec le paiement à l'usage.

Prix en entrée	$0.00 · 1M jetons
Prix en sortie	$0.00 · 1M jetons
Fenêtre de contexte	131.1K jetons
Points d'accès compatibles	openai
Éditeur	NVIDIA

§ 02

Appelez llama-3.3-nemotron-super-49b-v1.5 depuis votre code

Pointez n'importe quel SDK compatible OpenAI vers UnoRouter et demandez le modèle par son nom. Remplacez YOUR_API_KEY par une vraie clé issue de votre tableau de bord.

bash

curl https://api.unorouter.com/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "llama-3.3-nemotron-super-49b-v1.5",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

Connectez-vous pour remplir automatiquement votre clé API

§ 03

Questions fréquentes

Combien coûte llama-3.3-nemotron-super-49b-v1.5 par 1M jetons ?

L'entrée est facturée à $0.00 par 1M jetons, la sortie à $0.00 par 1M jetons. La facturation se fait au jeton, sans arrondi par lots.

Comment accéder à llama-3.3-nemotron-super-49b-v1.5 via l'API ?

Envoyez vos requêtes au point d'accès /v1/chat/completions de UnoRouter avec model=llama-3.3-nemotron-super-49b-v1.5. Toute bibliothèque cliente compatible OpenAI fonctionne. L'authentification utilise un jeton Bearer standard.