Доступно сейчас
NVIDIA

llama-3.3-nemotron-super-49b-v1.5

Llama-3.3-Nemotron-Super-49B-v1.5 is a 49B-parameter, English-centric reasoning/chat model derived from Meta’s Llama-3.3-70B-Instruct with a 128K context. It’s post-trained for agentic workflows (RAG, tool calling) via SFT across math, code, science, and...

TextReasoningTools131.1K
ВходБесплатно
ВыходБесплатно
Контекст131.1K
Эндпоинтыopenai

Возможности

РассуждениеИнструментыСтруктурир.

Модальности

Вход
text
Выход
text

Краткая статистика

Контекстное окно131.1K
Макс. вывод131.1K
Режимchat
ТокенизаторLlama3
Дата знаний2024
Квантизацияfp8

Производительность

Загрузка данных производительности...

Поддерж. параметры

ПараметрВсегдаПо умолчанию
frequency_penalty(не отправлять)
include_reasoning-
logit_bias-
max_tokens-
min_p-
presence_penalty(не отправлять)
reasoning-
repetition_penalty(не отправлять)
response_format-
seed-
stop-
temperature0.6
tool_choice-
tools-
top_k(не отправлять)
top_p0.95
§ 01

Тарифы

Цена за вход$0.00 · 1M токенов
Цена за выход$0.00 · 1M токенов
Окно контекста131.1K токенов
Совместимые эндпоинтыopenai
ВендорNVIDIA
§ 02

Вызовите llama-3.3-nemotron-super-49b-v1.5 из своего кода

Направьте любой OpenAI-совместимый SDK на UnoRouter и запросите модель по имени. Замените YOUR_API_KEY на реальный ключ из панели управления.

bash
curl https://api.unorouter.com/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "llama-3.3-nemotron-super-49b-v1.5",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

Войдите, чтобы автоматически подставить ваш ключ API

§ 03

Часто задаваемые вопросы

Сколько стоит llama-3.3-nemotron-super-49b-v1.5 за 1M токенов?

Вход стоит $0.00 за 1M токенов, выход $0.00 за 1M токенов. Тарификация потоковая, без округления до пачек.

Как получить доступ к llama-3.3-nemotron-super-49b-v1.5 через API?

Отправляйте запросы на эндпоинт /v1/chat/completions в UnoRouter с параметром model=llama-3.3-nemotron-super-49b-v1.5. Подойдёт любая OpenAI-совместимая клиентская библиотека. Для аутентификации используется стандартный Bearer-токен.

Какое окно контекста у llama-3.3-nemotron-super-49b-v1.5?

llama-3.3-nemotron-super-49b-v1.5 поддерживает окно контекста 131.1K токенов, которое делится между промптом и ответом модели.

§ 04

Похожие модели

Попробуйте llama-3.3-nemotron-super-49b-v1.5 прямо сейчас

Создайте ключ API и начните делать запросы менее чем за минуту.

Смотреть все модели