Jetzt verfügbar
NVIDIA

nemotron-3-ultra-550b-a55b

NVIDIA Nemotron 3 Ultra is an open frontier-reasoning and orchestration model from NVIDIA, with 55B active parameters out of 550B total (MoE). Built on a hybrid Transformer-Mamba mixture-of-experts architecture, it...

TextReasoningToolsOpen Weights1MCache262.1K
InputGratis
OutputGratis
Kontext262.1K
Endpunkteopenai

Funktionen

ReasoningToolsCacheStrukturiert

Modalitäten

Eingabe
text
Ausgabe
text

Kurzstatistik

Kontextfenster262.1K
Max. Ausgabe16.4K
TokenizerOther
Quantisierungbf16

Leistung

Lade Leistungsdaten...

Unterstützte Parameter

ParameterImmerStandard
frequency_penalty(nicht senden)
include_reasoning-
logit_bias-
max_tokens-
min_p-
presence_penalty(nicht senden)
reasoning-
repetition_penalty(nicht senden)
response_format-
seed-
stop-
structured_outputs-
temperature1
tool_choice-
tools-
top_k(nicht senden)
top_p0.95
§ 01

Preise

Input-Preis$0.00 · 1M Tokens
Output-Preis$0.00 · 1M Tokens
Kontextfenster262.1K Tokens
Kompatible Endpunkteopenai
AnbieterNVIDIA
§ 02

nemotron-3-ultra-550b-a55b aus deinem Code aufrufen

Richte jedes OpenAI-kompatible SDK auf UnoRouter aus und frage das Modell per Namen an. Ersetze YOUR_API_KEY durch einen echten Schlüssel aus deinem Dashboard.

bash
curl https://api.unorouter.com/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "nemotron-3-ultra-550b-a55b",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

Melde dich an, um deinen API-Key automatisch einzutragen

§ 03

Häufige Fragen

Was kostet nemotron-3-ultra-550b-a55b pro 1M Tokens?

Input kostet $0.00 pro 1M Tokens, Output $0.00 pro 1M Tokens. Abrechnung erfolgt pro Token, ohne Aufrundung auf Batch-Größen.

Wie greife ich per API auf nemotron-3-ultra-550b-a55b zu?

Sende Anfragen an den UnoRouter-Endpunkt /v1/chat/completions mit model=nemotron-3-ultra-550b-a55b. Jede OpenAI-kompatible Client-Bibliothek funktioniert. Die Authentifizierung erfolgt über einen Standard-Bearer-Token.

Wie groß ist das Kontextfenster von nemotron-3-ultra-550b-a55b?

nemotron-3-ultra-550b-a55b unterstützt ein Kontextfenster von 262.1K Tokens, aufgeteilt zwischen deinem Prompt und der Modellantwort.

§ 04

Ähnliche Modelle

nemotron-3-ultra-550b-a55b jetzt ausprobieren

Erstelle einen API-Schlüssel und starte in unter einer Minute.

Alle Modelle ansehen