Tersedia sekarang
NVIDIA

llama-3.3-nemotron-super-49b-v1.5

Llama-3.3-Nemotron-Super-49B-v1.5 is a 49B-parameter, English-centric reasoning/chat model derived from Meta’s Llama-3.3-70B-Instruct with a 128K context. It’s post-trained for agentic workflows (RAG, tool calling) via SFT across math, code, science, and...

TextReasoningTools131.1K
InputGratis
OutputGratis
Konteks131.1K
Endpointopenai

Kapabilitas

PenalaranAlatTerstruktur

Modalitas

Input
text
Output
text

Statistik cepat

Jendela konteks131.1K
Output maks131.1K
Modechat
TokenizerLlama3
Cutoff pengetahuan2024
Kuantisasifp8

Performa

Memuat data performa...

Parameter didukung

ParameterSelaluDefault
frequency_penalty(jangan kirim)
include_reasoning-
logit_bias-
max_tokens-
min_p-
presence_penalty(jangan kirim)
reasoning-
repetition_penalty(jangan kirim)
response_format-
seed-
stop-
temperature0.6
tool_choice-
tools-
top_k(jangan kirim)
top_p0.95
§ 01

Harga

Harga input$0.00 · 1M token
Harga output$0.00 · 1M token
Jendela konteks131.1K token
Endpoint kompatibelopenai
VendorNVIDIA
§ 02

Panggil llama-3.3-nemotron-super-49b-v1.5 dari kode Anda

Arahkan SDK kompatibel OpenAI apa pun ke UnoRouter dan minta model berdasarkan nama. Ganti YOUR_API_KEY dengan kunci asli dari dashboard Anda.

bash
curl https://api.unorouter.com/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "llama-3.3-nemotron-super-49b-v1.5",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

Masuk untuk mengisi otomatis kunci API Anda

§ 03

Pertanyaan yang sering diajukan

Berapa biaya llama-3.3-nemotron-super-49b-v1.5 per 1M token?

Input diberi harga $0.00 per 1M token, output $0.00 per 1M token. Penagihan per token, tanpa pembulatan ke ukuran batch.

Bagaimana cara saya mengakses llama-3.3-nemotron-super-49b-v1.5 melalui API?

Kirim permintaan ke endpoint UnoRouter /v1/chat/completions dengan model=llama-3.3-nemotron-super-49b-v1.5. Library klien yang kompatibel dengan OpenAI mana pun bekerja. Autentikasi menggunakan token Bearer standar.

Apa jendela konteks llama-3.3-nemotron-super-49b-v1.5?

llama-3.3-nemotron-super-49b-v1.5 mendukung jendela konteks 131.1K token, dibagikan antara prompt Anda dan respons model.

§ 04

Model serupa

Coba llama-3.3-nemotron-super-49b-v1.5 sekarang

Buat kunci API dan mulai membuat permintaan dalam waktu kurang dari satu menit.

Lihat semua model