Jetzt verfügbar

NVIDIA

llama-3.3-nemotron-super-49b-v1

Name: llama-3.3-nemotron-super-49b-v1
Brand: NVIDIA

Llama-3.3-Nemotron-Super-49B-v1.5 is a 49B-parameter, English-centric reasoning/chat model derived from Meta’s Llama-3.3-70B-Instruct with a 128K context. It’s post-trained for agentic workflows (RAG, tool calling) via SFT across math, code, science, and...

Text128KReasoningTools131.1K

InputGratis

OutputGratis

Kontext128K

Endpunkteopenai

Funktionen

ReasoningToolsStrukturiert

Modalitäten

Eingabe

text

Ausgabe

text

Kurzstatistik

Kontextfenster131.1K

Max. Ausgabe131.1K

Moduschat

TokenizerLlama3

Wissensstand2024

Quantisierungfp8

Hugging Facenvidia/Llama-3_3-Nemotron-Super-49B-v1_5

Leistung

Lade Leistungsdaten...

Unterstützte Parameter

Parameter	Immer	Standard
frequency_penalty		(nicht senden)
include_reasoning		-
logit_bias		-
max_tokens		-
min_p		-
presence_penalty		(nicht senden)
reasoning		-
repetition_penalty		(nicht senden)
response_format		-
seed		-
stop		-
temperature		0.6
tool_choice		-
tools		-
top_k		(nicht senden)
top_p		0.95

§ 01

Preise

Du zahlst nur, was du nutzt. Kein monatliches Minimum bei Pay As You Go.

Input-Preis	$0.00 · 1M Tokens
Output-Preis	$0.00 · 1M Tokens
Kontextfenster	128K Tokens
Kompatible Endpunkte	openai
Anbieter	NVIDIA

§ 02

llama-3.3-nemotron-super-49b-v1 aus deinem Code aufrufen

Richte jedes OpenAI-kompatible SDK auf UnoRouter aus und frage das Modell per Namen an. Ersetze YOUR_API_KEY durch einen echten Schlüssel aus deinem Dashboard.

bash

curl https://api.unorouter.com/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "llama-3.3-nemotron-super-49b-v1",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

Melde dich an, um deinen API-Key automatisch einzutragen

§ 03

Häufige Fragen

Was kostet llama-3.3-nemotron-super-49b-v1 pro 1M Tokens?

Input kostet $0.00 pro 1M Tokens, Output $0.00 pro 1M Tokens. Abrechnung erfolgt pro Token, ohne Aufrundung auf Batch-Größen.

Wie greife ich per API auf llama-3.3-nemotron-super-49b-v1 zu?

Sende Anfragen an den UnoRouter-Endpunkt /v1/chat/completions mit model=llama-3.3-nemotron-super-49b-v1. Jede OpenAI-kompatible Client-Bibliothek funktioniert. Die Authentifizierung erfolgt über einen Standard-Bearer-Token.

Wie groß ist das Kontextfenster von llama-3.3-nemotron-super-49b-v1?

llama-3.3-nemotron-super-49b-v1 unterstützt ein Kontextfenster von 128K Tokens, aufgeteilt zwischen deinem Prompt und der Modellantwort.

§ 04

llama-3.3-nemotron-super-49b-v1 jetzt ausprobieren

Erstelle einen API-Schlüssel und starte in unter einer Minute.

Alle Modelle ansehen