Доступно сейчас

NVIDIA

llama-3.3-nemotron-super-49b-v1

Name: llama-3.3-nemotron-super-49b-v1
Brand: NVIDIA

Llama-3.3-Nemotron-Super-49B-v1.5 is a 49B-parameter, English-centric reasoning/chat model derived from Meta’s Llama-3.3-70B-Instruct with a 128K context. It’s post-trained for agentic workflows (RAG, tool calling) via SFT across math, code, science, and...

Text128KReasoningTools131.1K

ВходБесплатно

ВыходБесплатно

Контекст128K

Эндпоинтыopenai

Возможности

РассуждениеИнструментыСтруктурир.

Модальности

Вход

text

Выход

text

Краткая статистика

Контекстное окно131.1K

Макс. вывод131.1K

Режимchat

ТокенизаторLlama3

Дата знаний2024

Квантизацияfp8

Hugging Facenvidia/Llama-3_3-Nemotron-Super-49B-v1_5

Производительность

Загрузка данных производительности...

Поддерж. параметры

Параметр	Всегда	По умолчанию
frequency_penalty		(не отправлять)
include_reasoning		-
logit_bias		-
max_tokens		-
min_p		-
presence_penalty		(не отправлять)
reasoning		-
repetition_penalty		(не отправлять)
response_format		-
seed		-
stop		-
temperature		0.6
tool_choice		-
tools		-
top_k		(не отправлять)
top_p		0.95

§ 01

Тарифы

Платите только за то, что используете. При оплате Pay As You Go нет минимальной месячной платы.

Цена за вход	$0.00 · 1M токенов
Цена за выход	$0.00 · 1M токенов
Окно контекста	128K токенов
Совместимые эндпоинты	openai
Вендор	NVIDIA

§ 02

Вызовите llama-3.3-nemotron-super-49b-v1 из своего кода

Направьте любой OpenAI-совместимый SDK на UnoRouter и запросите модель по имени. Замените YOUR_API_KEY на реальный ключ из панели управления.

bash

curl https://api.unorouter.com/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "llama-3.3-nemotron-super-49b-v1",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

Войдите, чтобы автоматически подставить ваш ключ API

§ 03

Часто задаваемые вопросы

Сколько стоит llama-3.3-nemotron-super-49b-v1 за 1M токенов?

Вход стоит $0.00 за 1M токенов, выход $0.00 за 1M токенов. Тарификация потоковая, без округления до пачек.

Как получить доступ к llama-3.3-nemotron-super-49b-v1 через API?

Отправляйте запросы на эндпоинт /v1/chat/completions в UnoRouter с параметром model=llama-3.3-nemotron-super-49b-v1. Подойдёт любая OpenAI-совместимая клиентская библиотека. Для аутентификации используется стандартный Bearer-токен.

Какое окно контекста у llama-3.3-nemotron-super-49b-v1?

llama-3.3-nemotron-super-49b-v1 поддерживает окно контекста 128K токенов, которое делится между промптом и ответом модели.

§ 04

Попробуйте llama-3.3-nemotron-super-49b-v1 прямо сейчас

Создайте ключ API и начните делать запросы менее чем за минуту.

Смотреть все модели