Disponível agora
Zhipu

glm-4.5-air

GLM-4.5-Air is the lightweight variant of our latest flagship model family, also purpose-built for agent-centric applications. Like GLM-4.5, it adopts the Mixture-of-Experts (MoE) architecture but with a more compact parameter...

TextReasoningToolsOpen Weights131.1KCache
EntradaGrátis
SaídaGrátis
Contexto131.1K
Endpointsopenai

Capacidades

RaciocínioFerramentasCacheEstruturado

Modalidades

Entrada
text
Saída
text

Estatísticas rápidas

Janela de contexto131.1K
Saída máxima96K
Modochat
TokenizadorOther
Corte de conhecimento2024
Quantizaçãofp8

Desempenho

Carregando dados de desempenho...

Parâmetros suportados

ParâmetroSemprePadrão
frequency_penalty-(não enviar)
include_reasoning-
max_tokens-
presence_penalty--
reasoning-
repetition_penalty--
response_format--
seed--
stop--
temperature0.75
tool_choice-
tools-
top_k--
top_p(não enviar)
§ 01

Preços

Preço de entrada$0.00 · 1M tokens
Preço de saída$0.00 · 1M tokens
Janela de contexto131.1K tokens
Endpoints compatíveisopenai
FornecedorZhipu
§ 02

Chamar glm-4.5-air do seu código

Aponte qualquer SDK compatível com OpenAI para UnoRouter e solicite o modelo pelo nome. Substitua YOUR_API_KEY por uma chave real do seu painel.

bash
curl https://api.unorouter.com/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "glm-4.5-air",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

Entre para preencher automaticamente sua chave API

§ 03

Perguntas frequentes

Quanto custa glm-4.5-air por 1M tokens?

A entrada custa $0.00 por 1M tokens, a saída $0.00 por 1M tokens. A cobrança é por token, sem arredondamento para tamanhos de lote.

Como acesso glm-4.5-air via API?

Envie solicitações ao endpoint /v1/chat/completions de UnoRouter com model=glm-4.5-air. Qualquer biblioteca cliente compatível com OpenAI funciona. A autenticação usa um token Bearer padrão.

Qual é a janela de contexto de glm-4.5-air?

glm-4.5-air suporta uma janela de contexto de 131.1K tokens, compartilhada entre seu prompt e a resposta do modelo.

§ 04

Modelos similares

Experimente glm-4.5-air agora

Crie uma chave API e comece a fazer solicitações em menos de um minuto.

Ver todos os modelos