Disponibile ora
Zhipu

glm-4.5-air

GLM-4.5-Air is the lightweight variant of our latest flagship model family, also purpose-built for agent-centric applications. Like GLM-4.5, it adopts the Mixture-of-Experts (MoE) architecture but with a more compact parameter...

TextReasoningToolsOpen Weights131.1KCache
InputGratis
OutputGratis
Contesto131.1K
Endpointopenai

Capacità

RagionamentoStrumentiCacheStrutturato

Modalità

Input
text
Output
text

Statistiche rapide

Finestra di contesto131.1K
Output massimo96K
Modalitàchat
TokenizerOther
Limite di conoscenza2024
Quantizzazionefp8

Performance

Caricamento dati di performance...

Parametri supportati

ParametroSemprePredefinito
frequency_penalty-(non inviare)
include_reasoning-
max_tokens-
presence_penalty--
reasoning-
repetition_penalty--
response_format--
seed--
stop--
temperature0.75
tool_choice-
tools-
top_k--
top_p(non inviare)
§ 01

Prezzi

Prezzo di input$0.00 · 1M token
Prezzo di output$0.00 · 1M token
Finestra di contesto131.1K token
Endpoint compatibiliopenai
ProviderZhipu
§ 02

Chiamare glm-4.5-air dal tuo codice

Punta qualsiasi SDK compatibile con OpenAI a UnoRouter e richiedi il modello per nome. Sostituisci YOUR_API_KEY con una vera chiave dal tuo dashboard.

bash
curl https://api.unorouter.com/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "glm-4.5-air",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

Accedi per compilare automaticamente la tua chiave API

§ 03

Domande frequenti

Quanto costa glm-4.5-air per 1M token?

L'input ha un prezzo di $0.00 per 1M token, l'output di $0.00 per 1M token. La fatturazione è per token, nessun arrotondamento alle dimensioni del batch.

Come accedo a glm-4.5-air tramite API?

Invia richieste all'endpoint /v1/chat/completions di UnoRouter con model=glm-4.5-air. Qualsiasi libreria client compatibile con OpenAI funziona. L'autenticazione usa un token Bearer standard.

Qual è la finestra di contesto di glm-4.5-air?

glm-4.5-air supporta una finestra di contesto di 131.1K token, condivisa tra il tuo prompt e la risposta del modello.

§ 04

Modelli simili

Prova glm-4.5-air ora

Crea una chiave API e inizia a fare richieste in meno di un minuto.

Vedi tutti i modelli