Question 1

Quanto costa llama-nemotron-embed-vl-1b-v2 per 1M token?

Accepted Answer

L'input ha un prezzo di $0.00 per 1M token, l'output di $0.00 per 1M token. La fatturazione è per token, nessun arrotondamento alle dimensioni del batch.

Question 2

Come accedo a llama-nemotron-embed-vl-1b-v2 tramite API?

Accepted Answer

Invia richieste all'endpoint /v1/chat/completions di UnoRouter con model=llama-nemotron-embed-vl-1b-v2. Qualsiasi libreria client compatibile con OpenAI funziona. L'autenticazione usa un token Bearer standard.

Question 3

Qual è la finestra di contesto di llama-nemotron-embed-vl-1b-v2?

Accepted Answer

llama-nemotron-embed-vl-1b-v2 supporta una finestra di contesto di 32.8K token, condivisa tra il tuo prompt e la risposta del modello.

Prezzo di input	$0.00 · 1M token
Prezzo di output	$0.00 · 1M token
Finestra di contesto	32.8K token
Endpoint compatibili	openai
Provider	NVIDIA

llama-nemotron-embed-vl-1b-v2

Performance

Prezzi

Chiamare llama-nemotron-embed-vl-1b-v2 dal tuo codice

Domande frequenti

Quanto costa llama-nemotron-embed-vl-1b-v2 per 1M token?

Come accedo a llama-nemotron-embed-vl-1b-v2 tramite API?

Qual è la finestra di contesto di llama-nemotron-embed-vl-1b-v2?

Modelli simili

Prova llama-nemotron-embed-vl-1b-v2 ora