Disponibile ora
NVIDIA

llama-nemotron-embed-vl-1b-v2

EmbeddingFilesOpen WeightsVision32.8K
InputGratis
OutputGratis
TipoEmbedding
Endpointopenai

Performance

Caricamento dati di performance...
§ 01

Prezzi

Prezzo di input$0.00 · 1M token
Prezzo di output$0.00 · 1M token
Finestra di contesto32.8K token
Endpoint compatibiliopenai
ProviderNVIDIA
§ 02

Chiamare llama-nemotron-embed-vl-1b-v2 dal tuo codice

Punta qualsiasi SDK compatibile con OpenAI a UnoRouter e richiedi il modello per nome. Sostituisci YOUR_API_KEY con una vera chiave dal tuo dashboard.

bash
curl https://api.unorouter.com/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "llama-nemotron-embed-vl-1b-v2",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

Accedi per compilare automaticamente la tua chiave API

§ 03

Domande frequenti

Quanto costa llama-nemotron-embed-vl-1b-v2 per 1M token?

L'input ha un prezzo di $0.00 per 1M token, l'output di $0.00 per 1M token. La fatturazione è per token, nessun arrotondamento alle dimensioni del batch.

Come accedo a llama-nemotron-embed-vl-1b-v2 tramite API?

Invia richieste all'endpoint /v1/chat/completions di UnoRouter con model=llama-nemotron-embed-vl-1b-v2. Qualsiasi libreria client compatibile con OpenAI funziona. L'autenticazione usa un token Bearer standard.

Qual è la finestra di contesto di llama-nemotron-embed-vl-1b-v2?

llama-nemotron-embed-vl-1b-v2 supporta una finestra di contesto di 32.8K token, condivisa tra il tuo prompt e la risposta del modello.

§ 04

Modelli simili

Prova llama-nemotron-embed-vl-1b-v2 ora

Crea una chiave API e inizia a fare richieste in meno di un minuto.

Vedi tutti i modelli