Qwen: Qwen3 Max Thinking
Qwen
Рассуждающая версия флагманской модели Qwen3-Max с более чем 1 трлн параметров, обученная на 36 трлн токенов и усиленная масштабным обучением с подкреплением; поддерживает режим глубокого мышления с настраиваемым бюджетом токенов, контекст до 1 млн токенов и демонстрирует производительность уровня GPT-5.2-Thinking и Claude-Opus-4.5 в сложных задачах рассуждений и кодирования.
Чтобы сгенерировать ключ, авторизуйтесь и пополните баланс
Производительность
Количество параметров:
-
Контекстное окно:
256000
Latency:
3.2 сек
Throughput:
33.27 токенов/сек
Ценообразование за 1M токенов
Input:
55 ₽
Output:
219 ₽
Хронология
Дата релиза:
-
Knowledge Cutoff:
-
Модальности
Input
Text
Image
Video
Output
Text
Функциональные и технические возможности
Mixture of Experts
Vision
Fine-tuning
Function Calling
On-premise
Как получить доступ к qwen3-max-thinking по API
2
Приступайте к работе
Используйте любой SDK, совместимый с OpenAI, чтобы встроить qwen3-max-thinking в ваше приложение.
Пример интеграции
import openai
client = openai.OpenAI(
api_key="your-api-key",
base_url="https://api.vsellm.ru/v1"
)
response = client.chat.completions.create(
model="qwen/qwen3-max-thinking",
messages=[
{"role": "user", "content": "Привет!"}
]
)
print(response.choices[0].message.content)