Добавили долгожданный флагман и специализированные модели для RAG-систем: Мы полностью переработали раздел vsellm.ru/docs. Цель — сделать интеграцию максимально прозрачной и предсказуемой: Обновили существующие инструкции и добавили новые разделы для популярных фреймворков. Теперь вкатываться в разработку на VseLLM стало быстрее. В ночь с 8 на 9 мая мы проведем плановое обновление программного обеспечения сервиса. Потребуются кратковременные перезапуски систем. Мы понимаем критичность аптайма для ваших процессов, но эти работы необходимы для поддержания долгосрочной стабильности и безопасности. Приносим извинения за неудобства.Майское обновление: GPT-5.5, эмбеддинги Qwen 3 и ревизия документации
1. Обновление каталога моделей
openai/gpt-5.5 — расширение возможностей текущего поколения моделей от OpenAI.qwen/qwen3-embedding-8b и qwen/qwen3-embedding-4b — высокопроизводительные модели для задач векторного поиска.2. Масштабный апдейт документации
extra_body (например, thinking_budget, thinking_level и специфические настройки для работы с аудио).nullable: true в JSON Schema — при работе с Gemini рекомендуется использовать конструкцию anyOf.3. Новые разделы интеграций
Майское обновление: GPT-5.5, эмбеддинги Qwen 3 и ревизия документации
Добавили OpenAI GPT-5.5 и новые эмбеддинги Qwen 3. Полностью обновили документацию: параметры AIR, настройки extra_body и ограничения моделей. График техработ 8-9 мая.
⚠️ Запланированные технические работы