VSELLM

VSELLM

Единый API-доступ к лучшим AI-моделям

Передовые модели

Claude Sonnet 4.6
Передовая модель Anthropic

Claude Sonnet 4.6

Высокоэффективная версия Claude 4.6, оптимизированная для скорости и низкой стоимости при хорошей производительности в кодировании и агентских задачах.

GPT-5 Нейросеть нового поколения

GPT-5

Флагманская языковая модель с продвинутыми возможностями рассуждения, программирования и анализа сложных контекстов.

Gemini 2.5 Pro Линейка Google DeepMind

Gemini 2.5 Pro

Мощная мультимодальная модель от Google, оптимизированная для сложных задач рассуждения, работы с кодом и анализа данных.

Чтобы сгенерировать ключ, авторизуйтесь и пополните баланс

Цены указаны за 1 млн токенов, за генерацию 1 изображения или за 1 минуту входного аудио.

Модель ID Цена Input Цена Output Контекст Latency (сек) Throughput (т/сек) Квантизация Function
Calling
Подключение
gpt-5.4-mini openai/gpt-5.4-mini 83 ₽ 497 ₽ 400000 1.75 28.01 -
deepseek-v3.2 deepseek/deepseek-v3.2 44 ₽ 66 ₽ 128000 2.27 27.93 -
glm-4.6v-flash z-ai/glm-4.6v-flash 1 ₽ 8 ₽ 128000 12.77 43.25 -
qwen3-vl-30b-a3b-instruct qwen/qwen3-vl-30b-a3b-instruct 17 ₽ 66 ₽ 128000 4.06 9.58 -
gpt-5.1-chat openai/gpt-5.1-chat 138 ₽ 1105 ₽ 128000 5.12 79.05 -
qwen3-vl-plus qwen/qwen3-vl-plus 22 ₽ 219 ₽ 256000 1.89 10.6 -
kimi-k2-0905 moonshotai/kimi-k2-0905 61 ₽ 306 ₽ 262144 2.43 5.79 -
chatgpt-4o-latest openai/chatgpt-4o-latest 552 ₽ 1658 ₽ 128000 0.98 17.62 -
qwen3-coder-next qwen/qwen3-coder-next 22 ₽ 89 ₽ 256000 0.65 21.22 -
gpt-oss-20b openai/gpt-oss-20b 5 ₽ 21 ₽ 131072 1.52 162.77 FP4/FP8
qwen3-235b-a22b qwen/qwen3-235b-a22b 44 ₽ 175 ₽ 128000 2.2 49.78 FP8/BF16
qwen3.6-plus qwen/qwen3.6-plus 42 ₽ 253 ₽ 1000000 22.86 51.55 -
qwen3-max-thinking qwen/qwen3-max-thinking 55 ₽ 219 ₽ 256000 1.98 7.71 -
gpt-5.4-nano openai/gpt-5.4-nano 22 ₽ 138 ₽ 400000 1.86 57.95 -
qwen3.7-max qwen/qwen3.7-max 252 ₽ 758 ₽ 1000000 3.96 35.27 -
claude-opus-4.6 anthropic/claude-opus-4.6 552 ₽ 2762 ₽ 1000000 182.17 59.86 -
glm-4.7 z-ai/glm-4.7 66 ₽ 243 ₽ 202752 3.63 23.96 -
gpt-5-chat openai/gpt-5-chat 138 ₽ 1105 ₽ 128000 1.12 13.71 -
claude-opus-4.5 anthropic/claude-opus-4.5 552 ₽ 2762 ₽ 200000 22.87 48.89 -
claude-sonnet-4.5 anthropic/claude-sonnet-4.5 332 ₽ 1658 ₽ 1000000 7.76 81.83 -
claude-sonnet-4.6 anthropic/claude-sonnet-4.6 332 ₽ 1658 ₽ 1000000 2.73 35.22 -
kimi-k2.5 moonshotai/kimi-k2.5 66 ₽ 332 ₽ 262144 1.41 52.04 -
glm-4.6v-flashx z-ai/glm-4.6v-flashx 6 ₽ 61 ₽ 128000 2.22 28.84 -
gemini-2.5-pro google/gemini-2.5-pro 138 ₽ 1105 ₽ 1048576 18.69 129.33 -
gpt-5-nano openai/gpt-5-nano 6 ₽ 44 ₽ 400000 1.8 24.66 -
gpt-5.4 openai/gpt-5.4 276 ₽ 1658 ₽ 1050000 2.59 6.2 -
gpt-4.1 openai/gpt-4.1 221 ₽ 884 ₽ 1047576 1.01 23.43 -
gpt-4.1-mini openai/gpt-4.1-mini 44 ₽ 177 ₽ 1047576 1.64 69.46 -
qwen3.5-plus qwen/qwen3.5-plus 18 ₽ 105 ₽ 1000000 20.87 15.79 -
qwen3-vl-8b-thinking qwen/qwen3-vl-8b-thinking 11 ₽ 110 ₽ 128000 4.21 60.8 -
glm-5.1 z-ai/glm-5.1 126 ₽ 505 ₽ 202752 3.94 24.22 -
qwen3-vl-30b-a3b-thinking qwen/qwen3-vl-30b-a3b-thinking 17 ₽ 164 ₽ 128000 3.11 73.94 -
qwen3-vl-235b-a22b-thinking qwen/qwen3-vl-235b-a22b-thinking 44 ₽ 439 ₽ 128000 5.13 34.6 -
deepseek-v3.2-speciale deepseek/deepseek-v3.2-speciale 61 ₽ 184 ₽ 163840 1.93 54.11 -
mimo-v2-flash xiaomi/mimo-v2-flash 14 ₽ 44 ₽ 262144 1.51 16.67 -
glm-4.6v z-ai/glm-4.6v 46 ₽ 138 ₽ 128000 3.0 34.87 -
deepseek-v4-flash deepseek/deepseek-v4-flash 21 ₽ 42 ₽ 1000000 6.11 34.7 -
gpt-5.2-codex openai/gpt-5.2-codex 193 ₽ 1547 ₽ 400000 1.96 18.28 -
gemini-3-flash-preview google/gemini-3-flash-preview 55 ₽ 332 ₽ 1048576 1.21 101.15 -
gpt-5-mini openai/gpt-5-mini 28 ₽ 221 ₽ 400000 1.73 46.29 -
deepseek-r1-distill-llama-70b deepseek/deepseek-r1-distill-llama-70b 107 ₽ 122 ₽ 131072 5.49 35.84 FP8/BF16
deepseek-chat-v3-0324 deepseek/deepseek-chat-v3-0324 38 ₽ 153 ₽ 163840 3.0 7.41 -
qwen3-vl-235b-a22b-instruct qwen/qwen3-vl-235b-a22b-instruct 44 ₽ 175 ₽ 128000 7.6 31.04 -
qwen3-vl-flash qwen/qwen3-vl-flash 3 ₽ 33 ₽ 256000 1.79 22.27 -
kimi-k2.6 moonshotai/kimi-k2.6 137 ₽ 568 ₽ 256000 4.42 16.13 -
gpt-5.3-chat openai/gpt-5.3-chat 193 ₽ 1547 ₽ 128000 5.27 30.84 -
glm-5 z-ai/glm-5 110 ₽ 354 ₽ 202752 5.17 16.3 -
claude-sonnet-4 anthropic/claude-sonnet-4 332 ₽ 1658 ₽ 1000000 2.75 57.69 -
gpt-5.2-chat openai/gpt-5.2-chat 193 ₽ 1547 ₽ 128000 1.37 17.27 -
gpt-5.1 openai/gpt-5.1 138 ₽ 1105 ₽ 400000 1.17 21.73 -
claude-opus-4.7 anthropic/claude-opus-4.7 552 ₽ 2762 ₽ 1000000 3.24 34.39 -
gpt5.1-pro yandex/gpt5.1-pro 800 ₽ 800 ₽ 32000 1.02 108.72 -
claude-haiku-4.5 anthropic/claude-haiku-4.5 110 ₽ 552 ₽ 200000 2.26 70.71 -
qwen3-vl-8b-instruct qwen/qwen3-vl-8b-instruct 11 ₽ 44 ₽ 128000 1.24 19.6 -
mimo-v2.5 xiaomi/mimo-v2.5 21 ₽ 43 ₽ 1048576 3.08 24.48 -
glm-4.5-air z-ai/glm-4.5-air 20 ₽ 130 ₽ 131072 4.2 27.23 -
gpt-5.3-codex openai/gpt-5.3-codex 193 ₽ 1547 ₽ 400000 2.04 6.96 -
gpt-4o-mini openai/gpt-4o-mini 17 ₽ 66 ₽ 128000 3.27 37.29 -
gemini-2.5-flash google/gemini-2.5-flash 33 ₽ 276 ₽ 1048576 2.6 136.54 -
gpt-4.1-nano openai/gpt-4.1-nano 11 ₽ 44 ₽ 1047576 1.11 16.44 -
gpt-5.4-pro openai/gpt-5.4-pro 3315 ₽ 19890 ₽ 1050000 104.31 5.45 -
claude-opus-4.1 anthropic/claude-opus-4.1 1658 ₽ 8288 ₽ 200000 1.88 30.66 -
qwen3.5-flash qwen/qwen3.5-flash 4 ₽ 44 ₽ 1000000 25.56 137.71 -
llama-3.3-70b-instruct meta-llama/llama-3.3-70b-instruct 17 ₽ 49 ₽ 131072 1.85 9.57 FP8/FP16/BF16
glm-4.6 z-ai/glm-4.6 60 ₽ 291 ₽ 202752 2.76 37.12 -
gemini-3.1-flash-lite google/gemini-3.1-flash-lite 28 ₽ 166 ₽ 1048576 1.15 157.13 -
deepseek-v4-pro deepseek/deepseek-v4-pro 252 ₽ 505 ₽ 1000000 2.47 30.16 -
gemini-3.5-flash google/gemini-3.5-flash 166 ₽ 995 ₽ 1048576 1.53 54.08 -
qwen3.6-35b-a3b qwen/qwen3.6-35b-a3b 38 ₽ 227 ₽ 256000 2.81 93.22 -
gpt5-pro yandex/gpt5-pro 1560 ₽ 1560 ₽ 32000 0.47 21.28 -
gemini-3.1-pro-preview google/gemini-3.1-pro-preview 221 ₽ 1326 ₽ 1048576 5.94 76.64 -
mimo-v2.5-pro xiaomi/mimo-v2.5-pro 67 ₽ 133 ₽ 1048576 5.39 17.13 -
gpt-oss-120b openai/gpt-oss-120b 17 ₽ 66 ₽ 131072 2.09 240.0 FP4/FP8/BF16
gpt-5.5 openai/gpt-5.5 552 ₽ 3315 ₽ 1050000 2.94 10.91 -
gpt-5.2 openai/gpt-5.2 193 ₽ 1547 ₽ 400000 1.7 10.81 -
qwen3.6-flash qwen/qwen3.6-flash 25 ₽ 151 ₽ 1000000 4.21 83.38 -
glm-4.7-flash z-ai/glm-4.7-flash 8 ₽ 44 ₽ 202752 3.95 22.08 -
gpt-5 openai/gpt-5 138 ₽ 1105 ₽ 400000 2.9 27.77 -
qwen3.6-max-preview qwen/qwen3.6-max-preview 189 ₽ 1136 ₽ 256000 6.96 35.68 -
gemini-3.1-pro-preview-customtools google/gemini-3.1-pro-preview-customtools 221 ₽ 1326 ₽ 1048576 2.73 70.36 -
gpt5-lite yandex/gpt5-lite 260 ₽ 260 ₽ 32000 5.77 77.26 -
qwen3.5-397b-a17b qwen/qwen3.5-397b-a17b 26 ₽ 158 ₽ 256000 5.52 29.65 -

Скорость vs Цена Output

Оптимальное соотношение скорость/цена

Контекст vs Цена Output

Модели с лучшим контекстом за цену

Ключевые определения

Контекстное окно: максимальное общее количество входных и выходных токенов.
Throughput (скорость вывода): количество токенов в секунду, получаемых во время генерации токенов моделью.
Latency (задержка, время до первого токена): время до получения первого токена в секундах после отправки запроса к API.
Цена Output (вывода): цена за токен, сгенерированный моделью, выраженная в соответствующей валюте за миллион токенов.
Цена Input (ввода): цена за токен, включенный в запрос/сообщение, отправленное к API.