Майское обновление: GPT-5.5, эмбеддинги Qwen 3 и ревизия документации

Добавили OpenAI GPT-5.5 и новые эмбеддинги Qwen 3. Полностью обновили документацию: параметры AIR, настройки extra_body и ограничения моделей. График техработ 8-9 мая.

Майское обновление: GPT-5.5, эмбеддинги Qwen 3 и ревизия документации

Майское обновление: GPT-5.5, эмбеддинги Qwen 3 и ревизия документации

1. Обновление каталога моделей

Добавили долгожданный флагман и специализированные модели для RAG-систем:

  • openai/gpt-5.5 — расширение возможностей текущего поколения моделей от OpenAI.
  • qwen/qwen3-embedding-8b и qwen/qwen3-embedding-4b — высокопроизводительные модели для задач векторного поиска.

2. Масштабный апдейт документации

Мы полностью переработали раздел vsellm.ru/docs. Цель — сделать интеграцию максимально прозрачной и предсказуемой:

  • Синхронизация параметров: Все параметры моделей обновлены согласно актуальным автотестам и спецификациям AIR (на базе документации для AIR от Михаила).
  • Расширенные настройки: В документацию добавлены описания параметров extra_body (например, thinking_budget, thinking_level и специфические настройки для работы с аудио).
  • Ограничения и нюансы: Описаны известные специфики маршрутизации. В частности, кейс с nullable: true в JSON Schema — при работе с Gemini рекомендуется использовать конструкцию anyOf.

3. Новые разделы интеграций

Обновили существующие инструкции и добавили новые разделы для популярных фреймворков. Теперь вкатываться в разработку на VseLLM стало быстрее.

⚠️ Запланированные технические работы

В ночь с 8 на 9 мая мы проведем плановое обновление программного обеспечения сервиса. Потребуются кратковременные перезапуски систем. Мы понимаем критичность аптайма для ваших процессов, но эти работы необходимы для поддержания долгосрочной стабильности и безопасности. Приносим извинения за неудобства.