llama-3.3-nemotron-super-49b-v1
Llama-3.3-Nemotron-Super-49B-v1.5 is a 49B-parameter, English-centric reasoning/chat model derived from Meta’s Llama-3.3-70B-Instruct with a 128K context. It’s post-trained for agentic workflows (RAG, tool calling) via SFT across math, code, science, and...
Capacités
Modalités
Statistiques rapides
Performance
Paramètres supportés
| Paramètre | Toujours | Par défaut |
|---|---|---|
| frequency_penalty | (ne pas envoyer) | |
| include_reasoning | - | |
| logit_bias | - | |
| max_tokens | - | |
| min_p | - | |
| presence_penalty | (ne pas envoyer) | |
| reasoning | - | |
| repetition_penalty | (ne pas envoyer) | |
| response_format | - | |
| seed | - | |
| stop | - | |
| temperature | 0.6 | |
| tool_choice | - | |
| tools | - | |
| top_k | (ne pas envoyer) | |
| top_p | 0.95 |
Tarification
| Prix en entrée | $0.00 · 1M jetons |
| Prix en sortie | $0.00 · 1M jetons |
| Fenêtre de contexte | 128K jetons |
| Points d'accès compatibles | openai |
| Éditeur | NVIDIA |
Appelez llama-3.3-nemotron-super-49b-v1 depuis votre code
Pointez n'importe quel SDK compatible OpenAI vers UnoRouter et demandez le modèle par son nom. Remplacez YOUR_API_KEY par une vraie clé issue de votre tableau de bord.
curl https://api.unorouter.com/v1/chat/completions \
-H "Authorization: Bearer YOUR_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"model": "llama-3.3-nemotron-super-49b-v1",
"messages": [{"role": "user", "content": "Hello!"}]
}'Questions fréquentes
Combien coûte llama-3.3-nemotron-super-49b-v1 par 1M jetons ?
L'entrée est facturée à $0.00 par 1M jetons, la sortie à $0.00 par 1M jetons. La facturation se fait au jeton, sans arrondi par lots.
Comment accéder à llama-3.3-nemotron-super-49b-v1 via l'API ?
Envoyez vos requêtes au point d'accès /v1/chat/completions de UnoRouter avec model=llama-3.3-nemotron-super-49b-v1. Toute bibliothèque cliente compatible OpenAI fonctionne. L'authentification utilise un jeton Bearer standard.
Quelle est la fenêtre de contexte de llama-3.3-nemotron-super-49b-v1 ?
llama-3.3-nemotron-super-49b-v1 prend en charge une fenêtre de contexte de 128K jetons, partagée entre votre invite et la réponse du modèle.
Modèles similaires
Essayez llama-3.3-nemotron-super-49b-v1 maintenant
Créez une clé API et commencez à faire des requêtes en moins d'une minute.