Z.AI: GLM 4.7 Flash

zAI

GLM-4.7-Flash — 30B-модель от Zhipu AI, предлагающая сбалансированное сочетание производительности и эффективности. Оптимизирована для агентных сценариев кодинга, долгосрочного планирования и совместной работы с инструментами, достигая лидирующих результатов среди открытых моделей своего размера.

Начать работу

Чтобы сгенерировать ключ, авторизуйтесь и пополните баланс

Производительность

Количество параметров: -

Контекстное окно: 202752

Latency: 3.71 сек

Throughput: 31.15 токенов/сек

Ценообразование за 1M токенов

Input: 8 ₽

Output: 44 ₽

Хронология

Дата релиза: -

Knowledge Cutoff: -

Модальности

Input Text Image

Output Text

Функциональные и технические возможности

Mixture of Experts

Vision

Fine-tuning

Function Calling

On-premise

Как получить доступ к glm-4.7-flash по API

Пополните баланс и получите API-ключ

Войти в личный кабинет

Приступайте к работе

Используйте любой SDK, совместимый с OpenAI, чтобы встроить glm-4.7-flash в ваше приложение.

Пример интеграции

import openai

client = openai.OpenAI(
    api_key="your-api-key",
    base_url="https://api.vsellm.ru/v1"
)

response = client.chat.completions.create(
    model="z-ai/glm-4.7-flash",
    messages=[
        {"role": "user", "content": "Привет!"}
    ]
)

print(response.choices[0].message.content)