qwen3-235b-a22b

Qwen: Qwen3 235B A22B

Qwen

Флагманская версия Qwen3 с архитектурой Mixture‑of‑Experts (235 млрд параметров, ~22 млрд активных), обеспечивающая высокое качество генерации текста, программирования, рассуждений и поддержки длинного контекста. Поддерживает переключение между режимами «thinking» (глубокое пошаговое рассуждение) и «instruct» (быстрое следование инструкциям) через параметр enable_thinking. Отличается сильной мультиязычностью и широким спектром задач.

Начать работу

Чтобы сгенерировать ключ, авторизуйтесь и пополните баланс

Производительность

Количество параметров: -
Контекстное окно: 128000
Latency: 1.13 сек
Throughput: 56.81 токенов/сек

Ценообразование за 1M токенов

Input: 31 ₽
Output: 92 ₽

Хронология

Дата релиза: -
Knowledge Cutoff: -

Модальности

Input Text
Output Text

Функциональные и технические возможности

Mixture of Experts
Vision
Fine-tuning
Function Calling
On-premise

Как получить доступ к qwen3-235b-a22b по API

1

Пополните баланс и получите API-ключ

Войти в личный кабинет
2

Приступайте к работе

Используйте любой SDK, совместимый с OpenAI, чтобы встроить qwen3-235b-a22b в ваше приложение.

Пример интеграции
import requests

url = "https://api.vsellm.ru/v1/chat/completions"
headers = {
    "Authorization": "Bearer your-api-key",
    "Content-Type": "application/json"
}
data = {
    "model": "qwen/qwen3-235b-a22b",
    "messages": [{"role": "user", "content": "Привет!"}],
    "enable_thinking": False
}

resp = requests.post(url, json=data, headers=headers)
print(resp.json()["choices"][0]["message"]["content"])