Qwen: Qwen3 235B A22B
Qwen
Флагманская версия Qwen3 с архитектурой Mixture‑of‑Experts (235 млрд параметров, ~22 млрд активных), обеспечивающая высокое качество генерации текста, программирования, рассуждений и поддержки длинного контекста. Поддерживает переключение между режимами «thinking» (глубокое пошаговое рассуждение) и «instruct» (быстрое следование инструкциям) через параметр enable_thinking. Отличается сильной мультиязычностью и широким спектром задач.
Чтобы сгенерировать ключ, авторизуйтесь и пополните баланс
Производительность
Количество параметров:
-
Контекстное окно:
128000
Latency:
1.13 сек
Throughput:
56.81 токенов/сек
Ценообразование за 1M токенов
Input:
31 ₽
Output:
92 ₽
Хронология
Дата релиза:
-
Knowledge Cutoff:
-
Модальности
Input
Text
Output
Text
Функциональные и технические возможности
Mixture of Experts
Vision
Fine-tuning
Function Calling
On-premise
Как получить доступ к qwen3-235b-a22b по API
2
Приступайте к работе
Используйте любой SDK, совместимый с OpenAI, чтобы встроить qwen3-235b-a22b в ваше приложение.
Пример интеграции
import requests
url = "https://api.vsellm.ru/v1/chat/completions"
headers = {
"Authorization": "Bearer your-api-key",
"Content-Type": "application/json"
}
data = {
"model": "qwen/qwen3-235b-a22b",
"messages": [{"role": "user", "content": "Привет!"}],
"enable_thinking": False
}
resp = requests.post(url, json=data, headers=headers)
print(resp.json()["choices"][0]["message"]["content"])