Disponible ahora
Zhipu

glm-4.5-air

GLM-4.5-Air is the lightweight variant of our latest flagship model family, also purpose-built for agent-centric applications. Like GLM-4.5, it adopts the Mixture-of-Experts (MoE) architecture but with a more compact parameter...

TextReasoningToolsOpen Weights131.1KCache
EntradaGratis
SalidaGratis
Contexto131.1K
Endpointsopenai

Capacidades

RazonamientoHerramientasCachéEstructurado

Modalidades

Entrada
text
Salida
text

Estadísticas rápidas

Ventana de contexto131.1K
Salida máxima96K
Modochat
TokenizadorOther
Corte de conocimiento2024
Cuantizaciónfp8

Rendimiento

Cargando datos de rendimiento...

Parámetros compatibles

ParámetroSiemprePredeterminado
frequency_penalty-(no enviar)
include_reasoning-
max_tokens-
presence_penalty--
reasoning-
repetition_penalty--
response_format--
seed--
stop--
temperature0.75
tool_choice-
tools-
top_k--
top_p(no enviar)
§ 01

Precios

Precio de entrada$0.00 · 1M tokens
Precio de salida$0.00 · 1M tokens
Ventana de contexto131.1K tokens
Endpoints compatiblesopenai
ProveedorZhipu
§ 02

Llamar a glm-4.5-air desde tu código

Apunta cualquier SDK compatible con OpenAI a UnoRouter y solicita el modelo por nombre. Reemplaza YOUR_API_KEY con una clave real de tu panel.

bash
curl https://api.unorouter.com/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "glm-4.5-air",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

Inicia sesión para autocompletar tu clave API

§ 03

Preguntas frecuentes

¿Cuánto cuesta glm-4.5-air por 1M tokens?

La entrada se cobra a $0.00 por 1M tokens, la salida a $0.00 por 1M tokens. La facturación es por token, sin redondeo a tamaños de lote.

¿Cómo accedo a glm-4.5-air vía API?

Envía solicitudes al endpoint /v1/chat/completions de UnoRouter con model=glm-4.5-air. Cualquier biblioteca cliente compatible con OpenAI funciona. La autenticación usa un token Bearer estándar.

¿Cuál es la ventana de contexto de glm-4.5-air?

glm-4.5-air soporta una ventana de contexto de 131.1K tokens, compartida entre tu prompt y la respuesta del modelo.

§ 04

Modelos similares

Prueba glm-4.5-air ahora

Crea una clave API y empieza a hacer solicitudes en menos de un minuto.

Ver todos los modelos