llama-3.3-nemotron-super-49b-v1.5
Llama-3.3-Nemotron-Super-49B-v1.5 is a 49B-parameter, English-centric reasoning/chat model derived from Meta’s Llama-3.3-70B-Instruct with a 128K context. It’s post-trained for agentic workflows (RAG, tool calling) via SFT across math, code, science, and...
Capacités
Modalités
Statistiques rapides
Performance
Paramètres supportés
| Paramètre | Toujours | Par défaut |
|---|---|---|
| frequency_penalty | (ne pas envoyer) | |
| include_reasoning | - | |
| logit_bias | - | |
| max_tokens | - | |
| min_p | - | |
| presence_penalty | (ne pas envoyer) | |
| reasoning | - | |
| repetition_penalty | (ne pas envoyer) | |
| response_format | - | |
| seed | - | |
| stop | - | |
| temperature | 0.6 | |
| tool_choice | - | |
| tools | - | |
| top_k | (ne pas envoyer) | |
| top_p | 0.95 |
Tarification
| Prix en entrée | $0.00 · 1M jetons |
| Prix en sortie | $0.00 · 1M jetons |
| Fenêtre de contexte | 131.1K jetons |
| Points d'accès compatibles | openai |
| Éditeur | NVIDIA |
Appelez llama-3.3-nemotron-super-49b-v1.5 depuis votre code
Pointez n'importe quel SDK compatible OpenAI vers UnoRouter et demandez le modèle par son nom. Remplacez YOUR_API_KEY par une vraie clé issue de votre tableau de bord.
curl https://api.unorouter.com/v1/chat/completions \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "llama-3.3-nemotron-super-49b-v1.5",
"messages": [{"role": "user", "content": "Hello!"}]
}'Questions fréquentes
Combien coûte llama-3.3-nemotron-super-49b-v1.5 par 1M jetons ?
L'entrée est facturée à $0.00 par 1M jetons, la sortie à $0.00 par 1M jetons. La facturation se fait au jeton, sans arrondi par lots.
Comment accéder à llama-3.3-nemotron-super-49b-v1.5 via l'API ?
Envoyez vos requêtes au point d'accès /v1/chat/completions de UnoRouter avec model=llama-3.3-nemotron-super-49b-v1.5. Toute bibliothèque cliente compatible OpenAI fonctionne. L'authentification utilise un jeton Bearer standard.
Quelle est la fenêtre de contexte de llama-3.3-nemotron-super-49b-v1.5 ?
llama-3.3-nemotron-super-49b-v1.5 prend en charge une fenêtre de contexte de 131.1K jetons, partagée entre votre invite et la réponse du modèle.
Modèles similaires
Essayez llama-3.3-nemotron-super-49b-v1.5 maintenant
Créez une clé API et commencez à faire des requêtes en moins d'une minute.