llama-3.3-nemotron-super-49b-v1.5

Name: llama-3.3-nemotron-super-49b-v1.5
Brand: NVIDIA

Llama-3.3-Nemotron-Super-49B-v1.5 is a 49B-parameter, English-centric reasoning/chat model derived from Meta’s Llama-3.3-70B-Instruct with a 128K context. It’s post-trained for agentic workflows (RAG, tool calling) via SFT across math, code, science, and...

TextReasoningTools131.1K

WejścieDarmowe

WyjścieDarmowe

Kontekst131.1K

Endpointyopenai

Możliwości

RozumowanieNarzędziaStrukturalne

Modalności

Wejście

text

Wyjście

text

Szybkie statystyki

Okno kontekstu131.1K

Maks. wyjście131.1K

Trybchat

TokenizerLlama3

Granica wiedzy2024

Kwantyzacjafp8

Hugging Facenvidia/Llama-3_3-Nemotron-Super-49B-v1_5

Wydajność

Ładowanie danych wydajności...

Obsługiwane parametry

Parametr	Zawsze	Domyślne
frequency_penalty		(nie wysyłaj)
include_reasoning		-
logit_bias		-
max_tokens		-
min_p		-
presence_penalty		(nie wysyłaj)
reasoning		-
repetition_penalty		(nie wysyłaj)
response_format		-
seed		-
stop		-
temperature		0.6
tool_choice		-
tools		-
top_k		(nie wysyłaj)
top_p		0.95

§ 01

Cennik

Płać tylko za to, czego używasz. Brak miesięcznych minimów przy użyciu Pay As You Go.

Cena wejścia	$0.00 · 1M tokenów
Cena wyjścia	$0.00 · 1M tokenów
Okno kontekstu	131.1K tokenów
Kompatybilne endpointy	openai
Dostawca	NVIDIA

§ 02

Wywołaj llama-3.3-nemotron-super-49b-v1.5 ze swojego kodu

Skieruj dowolny SDK kompatybilny z OpenAI na UnoRouter i zażądaj modelu po nazwie. Zastąp YOUR_API_KEY prawdziwym kluczem z twojego panelu.

bash

curl https://api.unorouter.com/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "llama-3.3-nemotron-super-49b-v1.5",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

Zaloguj się, aby automatycznie wypełnić klucz API

§ 03

Często zadawane pytania

Ile kosztuje llama-3.3-nemotron-super-49b-v1.5 za 1M tokenów?

Wejście kosztuje $0.00 za 1M tokenów, wyjście $0.00 za 1M tokenów. Rozliczanie jest per token, bez zaokrąglania do rozmiarów batcha.

Jak uzyskać dostęp do llama-3.3-nemotron-super-49b-v1.5 przez API?

Wysyłaj zapytania na endpoint UnoRouter /v1/chat/completions z model=llama-3.3-nemotron-super-49b-v1.5. Działa każda biblioteka klienta kompatybilna z OpenAI. Uwierzytelnianie używa standardowego tokenu Bearer.