Z.AI: GLM 4.5 Air
Z-Ai
Компактная версия мощной семейства GLM‑4.5 с меньшим числом параметров (~106 млрд) и гибридным режимом (thinking и non‑thinking). Предназначена для эффективной генерации текста, рассуждений и agent‑задач при низких вычислительных затратах и доступности открытого кода.
Чтобы сгенерировать ключ, авторизуйтесь и пополните баланс
Производительность
Количество параметров:
106.0B
Контекстное окно:
131072
Latency:
3.78 сек
Throughput:
67.98 токенов/сек
Ценообразование за 1M токенов
Input:
20 ₽
Output:
130 ₽
Хронология
Дата релиза:
03.12.2025
Knowledge Cutoff:
-
Модальности
Input
Text
Output
Text
Функциональные и технические возможности
Mixture of Experts
Vision
Fine-tuning
Function Calling
On-premise
Как получить доступ к glm-4.5-air по API
2
Приступайте к работе
Используйте любой SDK, совместимый с OpenAI, чтобы встроить glm-4.5-air в ваше приложение.
Пример интеграции
import openai
client = openai.OpenAI(
api_key="your-api-key",
base_url="https://api.vsellm.ru/v1"
)
response = client.chat.completions.create(
model="z-ai/glm-4.5-air",
messages=[
{"role": "user", "content": "Привет!"}
]
)
print(response.choices[0].message.content)