Disponible maintenant
NVIDIA

nemotron-3-ultra-550b-a55b

NVIDIA Nemotron 3 Ultra is an open frontier-reasoning and orchestration model from NVIDIA, with 55B active parameters out of 550B total (MoE). Built on a hybrid Transformer-Mamba mixture-of-experts architecture, it...

TextReasoningToolsOpen Weights1MCache262.1K
EntréeGratuit
SortieGratuit
Contexte262.1K
Points d'accèsopenai

Capacités

RaisonnementOutilsCacheStructuré

Modalités

Entrée
text
Sortie
text

Statistiques rapides

Fenêtre de contexte262.1K
Sortie max16.4K
TokenizerOther
Quantificationbf16

Performance

Chargement des performances...

Paramètres supportés

ParamètreToujoursPar défaut
frequency_penalty(ne pas envoyer)
include_reasoning-
logit_bias-
max_tokens-
min_p-
presence_penalty(ne pas envoyer)
reasoning-
repetition_penalty(ne pas envoyer)
response_format-
seed-
stop-
structured_outputs-
temperature1
tool_choice-
tools-
top_k(ne pas envoyer)
top_p0.95
§ 01

Tarification

Prix en entrée$0.00 · 1M jetons
Prix en sortie$0.00 · 1M jetons
Fenêtre de contexte262.1K jetons
Points d'accès compatiblesopenai
ÉditeurNVIDIA
§ 02

Appelez nemotron-3-ultra-550b-a55b depuis votre code

Pointez n'importe quel SDK compatible OpenAI vers UnoRouter et demandez le modèle par son nom. Remplacez YOUR_API_KEY par une vraie clé issue de votre tableau de bord.

bash
curl https://api.unorouter.com/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "nemotron-3-ultra-550b-a55b",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

Connectez-vous pour remplir automatiquement votre clé API

§ 03

Questions fréquentes

Combien coûte nemotron-3-ultra-550b-a55b par 1M jetons ?

L'entrée est facturée à $0.00 par 1M jetons, la sortie à $0.00 par 1M jetons. La facturation se fait au jeton, sans arrondi par lots.

Comment accéder à nemotron-3-ultra-550b-a55b via l'API ?

Envoyez vos requêtes au point d'accès /v1/chat/completions de UnoRouter avec model=nemotron-3-ultra-550b-a55b. Toute bibliothèque cliente compatible OpenAI fonctionne. L'authentification utilise un jeton Bearer standard.

Quelle est la fenêtre de contexte de nemotron-3-ultra-550b-a55b ?

nemotron-3-ultra-550b-a55b prend en charge une fenêtre de contexte de 262.1K jetons, partagée entre votre invite et la réponse du modèle.

§ 04

Modèles similaires

Essayez nemotron-3-ultra-550b-a55b maintenant

Créez une clé API et commencez à faire des requêtes en moins d'une minute.

Voir tous les modèles