llama-3.3-nemotron-super-49b-v1.5

Name: llama-3.3-nemotron-super-49b-v1.5
Brand: NVIDIA

Llama-3.3-Nemotron-Super-49B-v1.5 is a 49B-parameter, English-centric reasoning/chat model derived from Meta’s Llama-3.3-70B-Instruct with a 128K context. It’s post-trained for agentic workflows (RAG, tool calling) via SFT across math, code, science, and...

TextReasoningTools131.1K

InputGratis

OutputGratis

Konteks131.1K

Endpointopenai

Kapabilitas

PenalaranAlatTerstruktur

Modalitas

Input

text

Output

text

Statistik cepat

Jendela konteks131.1K

Output maks131.1K

Modechat

TokenizerLlama3

Cutoff pengetahuan2024

Kuantisasifp8

Hugging Facenvidia/Llama-3_3-Nemotron-Super-49B-v1_5

Performa

Memuat data performa...

Parameter didukung

Parameter	Selalu	Default
frequency_penalty		(jangan kirim)
include_reasoning		-
logit_bias		-
max_tokens		-
min_p		-
presence_penalty		(jangan kirim)
reasoning		-
repetition_penalty		(jangan kirim)
response_format		-
seed		-
stop		-
temperature		0.6
tool_choice		-
tools		-
top_k		(jangan kirim)
top_p		0.95

§ 01

Harga

Bayar hanya untuk yang Anda gunakan. Tidak ada minimum bulanan saat menggunakan Pay As You Go.

Harga input	$0.00 · 1M token
Harga output	$0.00 · 1M token
Jendela konteks	131.1K token
Endpoint kompatibel	openai
Vendor	NVIDIA

§ 02

Panggil llama-3.3-nemotron-super-49b-v1.5 dari kode Anda

Arahkan SDK kompatibel OpenAI apa pun ke UnoRouter dan minta model berdasarkan nama. Ganti YOUR_API_KEY dengan kunci asli dari dashboard Anda.

bash

curl https://api.unorouter.com/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "llama-3.3-nemotron-super-49b-v1.5",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

Masuk untuk mengisi otomatis kunci API Anda

§ 03

Pertanyaan yang sering diajukan

Berapa biaya llama-3.3-nemotron-super-49b-v1.5 per 1M token?

Input diberi harga $0.00 per 1M token, output $0.00 per 1M token. Penagihan per token, tanpa pembulatan ke ukuran batch.

Bagaimana cara saya mengakses llama-3.3-nemotron-super-49b-v1.5 melalui API?

Kirim permintaan ke endpoint UnoRouter /v1/chat/completions dengan model=llama-3.3-nemotron-super-49b-v1.5. Library klien yang kompatibel dengan OpenAI mana pun bekerja. Autentikasi menggunakan token Bearer standar.