Disponible ahora
Zhipu

glm-4.5

GLM-4.5 is our latest flagship foundation model, purpose-built for agent-based applications. It leverages a Mixture-of-Experts (MoE) architecture and supports a context length of up to 128k tokens. GLM-4.5 delivers significantly...

TextReasoningToolsOpen Weights131.1KCache
Entrada$0.48/ 1M
Salida$1.76/ 1M
Contexto131.1K
Endpointsopenai

Capacidades

RazonamientoHerramientasCachéEstructurado

Modalidades

Entrada
text
Salida
text

Estadísticas rápidas

Ventana de contexto131.1K
Salida máxima131.1K
Modochat
TokenizadorOther
Corte de conocimiento2024
Expiración2026
Cuantizaciónfp8
Hugging Facezai-org/GLM-4.5

Rendimiento

Cargando datos de rendimiento...

Parámetros compatibles

ParámetroSiemprePredeterminado
frequency_penalty-(no enviar)
include_reasoning-
max_tokens-
reasoning-
response_format-
temperature0.75
tool_choice-
tools-
top_k-
top_p(no enviar)
§ 01

Precios

Precio de entrada$0.48 · 1M tokens
Precio de salida$1.76 · 1M tokens
Ventana de contexto131.1K tokens
Endpoints compatiblesopenai
ProveedorZhipu
§ 02

Llamar a glm-4.5 desde tu código

Apunta cualquier SDK compatible con OpenAI a UnoRouter y solicita el modelo por nombre. Reemplaza YOUR_API_KEY con una clave real de tu panel.

bash
curl https://api.unorouter.com/v1/chat/completions \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "model": "glm-4.5",
    "messages": [{"role": "user", "content": "Hello!"}]
  }'

Inicia sesión para autocompletar tu clave API

§ 03

Preguntas frecuentes

¿Cuánto cuesta glm-4.5 por 1M tokens?

La entrada se cobra a $0.48 por 1M tokens, la salida a $1.76 por 1M tokens. La facturación es por token, sin redondeo a tamaños de lote.

¿Cómo accedo a glm-4.5 vía API?

Envía solicitudes al endpoint /v1/chat/completions de UnoRouter con model=glm-4.5. Cualquier biblioteca cliente compatible con OpenAI funciona. La autenticación usa un token Bearer estándar.

¿Cuál es la ventana de contexto de glm-4.5?

glm-4.5 soporta una ventana de contexto de 131.1K tokens, compartida entre tu prompt y la respuesta del modelo.

§ 04

Modelos similares

Prueba glm-4.5 ahora

Crea una clave API y empieza a hacer solicitudes en menos de un minuto.

Ver todos los modelos