Обновление каталога VseLLM: интеграция Z.ai GLM-5.2, Kimi K2.7 Code и Qwen3.7-Plus

🚀 Технические апдейты | Время чтения: ~4 минуты

Мы продолжаем расширять инфраструктурные возможности платформы VseLLM, добавляя самые свежие ИИ-инструменты для решения сложных инженерных и продуктовых задач. Сегодня в каталог добавлены три долгожданные модели, которые только что вышли на глобальный рынок ИИ и уже доступны для вызова через единый API-интерфейс шлюзов VseLLM.

1. Z.ai GLM-5.2 — Флагман нового поколения для длинного контекста

Компания Z.ai (бывшая Zhipu AI, технологический спин-офф Университета Цинхуа) официально презентовала свою новую флагманскую open-weight модель GLM-5.2, ориентированную на решение задач с длинным горизонтом планирования (Long-Horizon Tasks). Главная особенность архитектуры — полноценная и стабильная работа с контекстным окном в 1 миллион токенов.

Для того чтобы укротить терабайты вычислительных затрат на таком масштабе контекста, инженеры применили технологию IndexShare (DSA), где каждые 4 слоя трансформера делят между собой легковесный индексатор. На практике это дало колоссальный прирост пропускной способности (throughput) по мере роста контекста. Более того, GLM-5.2 совершила прорыв в тестах UI/UX-дизайна и multi-step автоматизации, обойдя в слепых тестах человеческих предпочтений (Design Arena) даже закрытые коммерческие альтернативы.

2. Moonshot AI Kimi K2.7 Code — Радикальное сокращение «передумывания»

Команда Moonshot AI представила специализированную кодовую итерацию своей флагманской Mixture-of-Experts (MoE) модели на 1 триллион параметров — Kimi K2.7 Code. Модель разработана специально под хардкорный инжиниринг, рефакторинг и работу в качестве автономных агентов.

Важное техническое отличие: По сравнению с версией K2.6, новая Kimi K2.7 Code использует в среднем на 30% меньше токенов рассуждения (reasoning tokens). Разработчики смогли существенно оптимизировать слой мышления, избавив ИИ от бесконечных логических циклов и «передумывания» (overthinking) без потери качества генерации.

Модель жестко зафиксирована в режиме preserve_thinking (не поддерживает non-thinking вызовы), что позволяет ей демонстрировать прирост на +21.8% в бенчмарке Kimi Code Bench v2 и вплотную приблизиться к лидерам рынка в многоязычном программировании (MLS Bench Lite).

3. Qwen3.7-Plus — Мультимодальный гибридный агент (Vision + Text)

Команда Alibaba Cloud выкатила крупное обновление своей линейки — мультимодального агента Qwen3.7-Plus. Разработчики объединили мощный текстовый стек Qwen3.7 с продвинутыми зрением (Vision), создав фундамент для сквозной продуктовой автоматизации.

Qwen3.7-Plus спроектирована как интерактивный гибридный агент. Она способна воспринимать сложные визуальные сцены, читать экраны интерфейсов, управлять GUI приложений и писать готовый frontend-код на основе обычных графических референсов. По уровню логики и работы с кодом в бенчмарках Terminal Bench 2.0 и SWE-bench модель Plus-тира максимально приблизилась к возможностям тяжелых Max-моделей, предлагая при этом гораздо более высокую скорость ответов и выгодную стоимость за миллион токенов.

Как начать работу?

Все три модели уже полностью развернуты на шлюзах VseLLM. Их рублевые тарифы, эндпоинты для интеграции и обновленная техническая документация доступны на сайте. Проверяйте конфигурации и переводите свои проекты на передовые ИИ-инструменты рынка!

Блог

Новые модели на VseLLM: Z.ai GLM-5.2, Kimi K2.7 Code и Qwen3.7-Plus

Обновление каталога VseLLM: интеграция Z.ai GLM-5.2, Kimi K2.7 Code и Qwen3.7-Plus

1. Z.ai GLM-5.2 — Флагман нового поколения для длинного контекста

2. Moonshot AI Kimi K2.7 Code — Радикальное сокращение «передумывания»

3. Qwen3.7-Plus — Мультимодальный гибридный агент (Vision + Text)

Как начать работу?