Обновление каталога VseLLM: интеграция Z.ai GLM-5.2, Kimi K2.7 Code и Qwen3.7-Plus
Мы продолжаем расширять инфраструктурные возможности платформы VseLLM, добавляя самые свежие ИИ-инструменты для решения сложных инженерных и продуктовых задач. Сегодня в каталог добавлены три долгожданные модели, которые только что вышли на глобальный рынок ИИ и уже доступны для вызова через единый API-интерфейс шлюзов VseLLM.
1. Z.ai GLM-5.2 — Флагман нового поколения для длинного контекста
Компания Z.ai (бывшая Zhipu AI, технологический спин-офф Университета Цинхуа) официально презентовала свою новую флагманскую open-weight модель GLM-5.2, ориентированную на решение задач с длинным горизонтом планирования (Long-Horizon Tasks). Главная особенность архитектуры — полноценная и стабильная работа с контекстным окном в 1 миллион токенов.
Для того чтобы укротить терабайты вычислительных затрат на таком масштабе контекста, инженеры применили технологию IndexShare (DSA), где каждые 4 слоя трансформера делят между собой легковесный индексатор. На практике это дало колоссальный прирост пропускной способности (throughput) по мере роста контекста. Более того, GLM-5.2 совершила прорыв в тестах UI/UX-дизайна и multi-step автоматизации, обойдя в слепых тестах человеческих предпочтений (Design Arena) даже закрытые коммерческие альтернативы.
2. Moonshot AI Kimi K2.7 Code — Радикальное сокращение «передумывания»
Команда Moonshot AI представила специализированную кодовую итерацию своей флагманской Mixture-of-Experts (MoE) модели на 1 триллион параметров — Kimi K2.7 Code. Модель разработана специально под хардкорный инжиниринг, рефакторинг и работу в качестве автономных агентов.
Модель жестко зафиксирована в режиме preserve_thinking (не поддерживает non-thinking вызовы), что позволяет ей демонстрировать прирост на +21.8% в бенчмарке Kimi Code Bench v2 и вплотную приблизиться к лидерам рынка в многоязычном программировании (MLS Bench Lite).
3. Qwen3.7-Plus — Мультимодальный гибридный агент (Vision + Text)
Команда Alibaba Cloud выкатила крупное обновление своей линейки — мультимодального агента Qwen3.7-Plus. Разработчики объединили мощный текстовый стек Qwen3.7 с продвинутыми зрением (Vision), создав фундамент для сквозной продуктовой автоматизации.
Qwen3.7-Plus спроектирована как интерактивный гибридный агент. Она способна воспринимать сложные визуальные сцены, читать экраны интерфейсов, управлять GUI приложений и писать готовый frontend-код на основе обычных графических референсов. По уровню логики и работы с кодом в бенчмарках Terminal Bench 2.0 и SWE-bench модель Plus-тира максимально приблизилась к возможностям тяжелых Max-моделей, предлагая при этом гораздо более высокую скорость ответов и выгодную стоимость за миллион токенов.
Как начать работу?
Все три модели уже полностью развернуты на шлюзах VseLLM. Их рублевые тарифы, эндпоинты для интеграции и обновленная техническая документация доступны на сайте. Проверяйте конфигурации и переводите свои проекты на передовые ИИ-инструменты рынка!