qwen3-vl-8b-thinking

Qwen: Qwen3 VL 8B Thinking

Qwen

Лёгкая мультимодальная модель семейства Qwen3‑VL с 8 млрд параметров, сфокусированная на глубоком рассуждении при обработке текстов и изображений. Подходит для задач визуального анализа и логики с умеренными ресурсными требованиями.

Начать работу

Чтобы сгенерировать ключ, авторизуйтесь и пополните баланс

Производительность

Количество параметров: 9.0B
Контекстное окно: 128000
Latency: 0.95 сек
Throughput: 80.34 токенов/сек

Ценообразование за 1M токенов

Input: 18 ₽
Output: 209 ₽

Хронология

Дата релиза: 11.12.2025
Knowledge Cutoff: -

Модальности

Input Text Image Video
Output Text

Функциональные и технические возможности

Mixture of Experts
Vision
Fine-tuning
Function Calling
On-premise

Как получить доступ к qwen3-vl-8b-thinking по API

1

Пополните баланс и получите API-ключ

Войти в личный кабинет
2

Приступайте к работе

Используйте любой SDK, совместимый с OpenAI, чтобы встроить qwen3-vl-8b-thinking в ваше приложение.

Пример интеграции
import openai

client = openai.OpenAI(
    api_key="your-api-key",
    base_url="https://api.vsellm.ru/v1"
)

response = client.chat.completions.create(
    model="qwen/qwen3-vl-8b-thinking",
    messages=[
        {"role": "user", "content": "Привет!"}
    ]
)

print(response.choices[0].message.content)