VSELLM

VSELLM

Единый API-доступ к лучшим AI-моделям

Передовые модели

Claude Sonnet 4.6
Передовая модель Anthropic

Claude Sonnet 4.6

Высокоэффективная версия Claude 4.6, оптимизированная для скорости и низкой стоимости при хорошей производительности в кодировании и агентских задачах.

GPT-5 Нейросеть нового поколения

GPT-5

Флагманская языковая модель с продвинутыми возможностями рассуждения, программирования и анализа сложных контекстов.

Gemini 2.5 Pro Линейка Google DeepMind

Gemini 2.5 Pro

Мощная мультимодальная модель от Google, оптимизированная для сложных задач рассуждения, работы с кодом и анализа данных.

Чтобы сгенерировать ключ, авторизуйтесь и пополните баланс

Цены указаны за 1 млн токенов, за генерацию 1 изображения или за 1 минуту входного аудио.

Модель ID Цена Input Цена Output Контекст Latency (сек) Throughput (т/сек) Квантизация Function
Calling
Подключение
mimo-v2.5-pro xiaomi/mimo-v2.5-pro 153 ₽ 459 ₽ 1048576 2.97 69.03 -
kimi-k2.6 moonshotai/kimi-k2.6 137 ₽ 568 ₽ 256000 1.75 42.64 -
qwen3.6-max-preview qwen/qwen3.6-max-preview 189 ₽ 1136 ₽ 256000 5.92 37.07 -
qwen3.6-flash qwen/qwen3.6-flash 25 ₽ 151 ₽ 1000000 0.44 158.93 -
qwen3.6-35b-a3b qwen/qwen3.6-35b-a3b 38 ₽ 227 ₽ 256000 1.48 155.45 -
qwen3-coder-next qwen/qwen3-coder-next 22 ₽ 89 ₽ 256000 2.18 148.43 -
qwen3-vl-plus qwen/qwen3-vl-plus 22 ₽ 219 ₽ 256000 1.39 53.83 -
glm-4.6v-flashx z-ai/glm-4.6v-flashx 6 ₽ 61 ₽ 128000 4.72 109.9 -
gpt5-pro yandex/gpt5-pro 1200 ₽ 1200 ₽ 32000 1.25 45.02 -
glm-4.7 z-ai/glm-4.7 46 ₽ 168 ₽ 202752 14.47 93.2 -
qwen3-vl-8b-instruct qwen/qwen3-vl-8b-instruct 11 ₽ 44 ₽ 128000 1.38 78.83 -
gpt-5.1-chat openai/gpt-5.1-chat 96 ₽ 765 ₽ 128000 1.36 141.1 -
qwen3-vl-flash qwen/qwen3-vl-flash 3 ₽ 33 ₽ 256000 4.08 126.36 -
gpt-5.1 openai/gpt-5.1 96 ₽ 765 ₽ 400000 5.2 44.48 -
glm-4.5-air z-ai/glm-4.5-air 20 ₽ 130 ₽ 131072 3.78 67.98 -
gpt-4.1 openai/gpt-4.1 153 ₽ 612 ₽ 1047576 0.88 66.2 -
gpt-5-mini openai/gpt-5-mini 19 ₽ 153 ₽ 400000 6.82 48.84 -
deepseek-v3.2 deepseek/deepseek-v3.2 44 ₽ 66 ₽ 128000 1.55 59.81 -
glm-4.6v-flash z-ai/glm-4.6v-flash 1 ₽ 8 ₽ 128000 13.05 58.52 -
qwen3-vl-30b-a3b-thinking qwen/qwen3-vl-30b-a3b-thinking 17 ₽ 164 ₽ 128000 7.54 260.88 -
gemini-2.5-pro google/gemini-2.5-pro 96 ₽ 765 ₽ 1048576 2.62 85.1 -
claude-sonnet-4 anthropic/claude-sonnet-4 332 ₽ 1658 ₽ 1000000 2.75 57.69 -
gpt-5.2-chat openai/gpt-5.2-chat 134 ₽ 1071 ₽ 128000 1.98 91.13 -
gpt-5-chat openai/gpt-5-chat 96 ₽ 765 ₽ 128000 0.56 59.23 -
gpt-4.1-mini openai/gpt-4.1-mini 31 ₽ 122 ₽ 1047576 0.84 56.47 -
gpt-4.1-nano openai/gpt-4.1-nano 8 ₽ 31 ₽ 1047576 0.8 67.31 -
chatgpt-4o-latest openai/chatgpt-4o-latest 382 ₽ 1148 ₽ 128000 0.55 97.31 -
gpt-oss-120b openai/gpt-oss-120b 11 ₽ 46 ₽ 131072 0.45 280.7 FP4/FP8/BF16
gpt-oss-20b openai/gpt-oss-20b 5 ₽ 21 ₽ 131072 0.4 205.4 FP4/FP8
gemini-2.5-flash google/gemini-2.5-flash 23 ₽ 191 ₽ 1048576 0.5 89.37 -
gemini-3-flash-preview google/gemini-3-flash-preview 38 ₽ 230 ₽ 1048576 1.59 73.55 -
qwen3-vl-235b-a22b-instruct qwen/qwen3-vl-235b-a22b-instruct 44 ₽ 175 ₽ 128000 1.21 45.32 -
gpt-5.4-nano openai/gpt-5.4-nano 15 ₽ 96 ₽ 400000 1.19 192.07 -
kimi-k2-0905 moonshotai/kimi-k2-0905 61 ₽ 306 ₽ 262144 30.13 11.05 -
qwen3.5-plus qwen/qwen3.5-plus 18 ₽ 105 ₽ 1000000 2.02 80.23 -
deepseek-r1-distill-llama-70b deepseek/deepseek-r1-distill-llama-70b 107 ₽ 122 ₽ 131072 0.47 114.8 FP8/BF16
qwen3-vl-30b-a3b-instruct qwen/qwen3-vl-30b-a3b-instruct 17 ₽ 66 ₽ 128000 1.26 77.36 -
qwen3-vl-8b-thinking qwen/qwen3-vl-8b-thinking 11 ₽ 110 ₽ 128000 0.95 80.34 -
qwen3.5-flash qwen/qwen3.5-flash 4 ₽ 44 ₽ 1000000 1.38 170.94 -
qwen3.5-397b-a17b qwen/qwen3.5-397b-a17b 26 ₽ 158 ₽ 256000 3.38 83.4 -
gpt5.1-pro yandex/gpt5.1-pro 400 ₽ 400 ₽ 32000 11.35 92.2 -
gpt5-lite yandex/gpt5-lite 200 ₽ 200 ₽ 32000 1.18 96.87 -
claude-haiku-4.5 anthropic/claude-haiku-4.5 110 ₽ 552 ₽ 200000 1.06 94.93 -
gpt-5.2 openai/gpt-5.2 134 ₽ 1071 ₽ 400000 5.01 40.18 -
glm-4.6 z-ai/glm-4.6 60 ₽ 291 ₽ 202752 5.66 48.87 -
gemini-3.1-flash-lite-preview google/gemini-3.1-flash-lite-preview 19 ₽ 115 ₽ 1048576 3.09 310.65 -
qwen3-max-thinking qwen/qwen3-max-thinking 55 ₽ 219 ₽ 256000 3.2 33.27 -
claude-opus-4.5 anthropic/claude-opus-4.5 552 ₽ 2762 ₽ 200000 2.96 59.58 -
gpt-5.4 openai/gpt-5.4 191 ₽ 1148 ₽ 1050000 1.86 30.8 -
GigaChat-2-Max GigaChat/GigaChat-2-Max 570 ₽ 570 ₽ 131072 10.86 11.7 -
claude-sonnet-4.5 anthropic/claude-sonnet-4.5 332 ₽ 1658 ₽ 1000000 2.38 58.96 -
gemini-3.1-pro-preview google/gemini-3.1-pro-preview 153 ₽ 918 ₽ 1048576 17.62 33.37 -
claude-opus-4.7 anthropic/claude-opus-4.7 552 ₽ 2762 ₽ 1000000 3.43 69.9 -
gpt-5.3-chat openai/gpt-5.3-chat 134 ₽ 1071 ₽ 128000 1.44 63.81 -
llama-3.3-70b-instruct meta-llama/llama-3.3-70b-instruct 17 ₽ 49 ₽ 131072 0.47 74.7 FP8/FP16/BF16
grok-code-fast-1 x-ai/grok-code-fast-1 15 ₽ 115 ₽ 256000 1.32 82.2 -
gpt-5.4-mini openai/gpt-5.4-mini 57 ₽ 344 ₽ 400000 1.45 127.11 -
gemini-3.1-pro-preview-customtools google/gemini-3.1-pro-preview-customtools 153 ₽ 918 ₽ 1048576 8.22 61.59 -
qwen3-235b-a22b qwen/qwen3-235b-a22b 44 ₽ 175 ₽ 128000 1.13 56.81 FP8/BF16
T-pro-it-2.0 t-tech/T-pro-it-2.0 27 ₽ 53 ₽ 32768 1.56 73.75 BF16
mimo-v2-omni xiaomi/mimo-v2-omni 61 ₽ 306 ₽ 262144 3.75 170.33 -
qwen3-vl-235b-a22b-thinking qwen/qwen3-vl-235b-a22b-thinking 44 ₽ 439 ₽ 128000 28.84 89.69 -
glm-5.1 z-ai/glm-5.1 126 ₽ 505 ₽ 202752 2.54 38.4 -
claude-sonnet-4.6 anthropic/claude-sonnet-4.6 332 ₽ 1658 ₽ 1000000 14.01 35.1 -
mimo-v2-flash xiaomi/mimo-v2-flash 14 ₽ 44 ₽ 262144 2.24 42.22 -
claude-opus-4.6 anthropic/claude-opus-4.6 552 ₽ 2762 ₽ 1000000 13.48 37.5 -
mimo-v2.5 xiaomi/mimo-v2.5 61 ₽ 306 ₽ 1048576 3.52 115.73 -
deepseek-chat-v3-0324 deepseek/deepseek-chat-v3-0324 29 ₽ 133 ₽ 163840 0.53 24.27 -
deepseek-v4-pro deepseek/deepseek-v4-pro 252 ₽ 505 ₽ 1000000 1.64 120.76 -
claude-opus-4.1 anthropic/claude-opus-4.1 1658 ₽ 8288 ₽ 200000 1.88 30.66 -
qwen3.6-plus qwen/qwen3.6-plus 42 ₽ 253 ₽ 1000000 1.49 55.63 -
gpt-5.4-pro openai/gpt-5.4-pro 2295 ₽ 13770 ₽ 1050000 104.31 5.45 -
gpt-4o-mini openai/gpt-4o-mini 11 ₽ 46 ₽ 128000 0.54 59.7 -
deepseek-v4-flash deepseek/deepseek-v4-flash 21 ₽ 42 ₽ 1000000 1.35 191.1 -
deepseek-v3.2-speciale deepseek/deepseek-v3.2-speciale 44 ₽ 129 ₽ 163840 0.78 41.67 -
gpt-5.3-codex openai/gpt-5.3-codex 134 ₽ 1071 ₽ 400000 6.45 42.38 -
gpt-5.2-codex openai/gpt-5.2-codex 134 ₽ 1071 ₽ 400000 7.03 38.01 -
gpt-5 openai/gpt-5 96 ₽ 765 ₽ 400000 8.7 35.51 -
gpt-5-nano openai/gpt-5-nano 4 ₽ 31 ₽ 400000 2.4 50.21 -
kimi-k2.5 moonshotai/kimi-k2.5 46 ₽ 230 ₽ 262144 20.8 36.21 -
mimo-v2-pro xiaomi/mimo-v2-pro 153 ₽ 459 ₽ 1048576 4.61 89.6 -
glm-5 z-ai/glm-5 76 ₽ 245 ₽ 202752 12.36 41.92 -
glm-4.6v z-ai/glm-4.6v 46 ₽ 138 ₽ 128000 20.69 23.87 -
glm-4.7-flash z-ai/glm-4.7-flash 5 ₽ 31 ₽ 202752 0.0 0.0 -

Скорость vs Цена Output

Оптимальное соотношение скорость/цена

Контекст vs Цена Output

Модели с лучшим контекстом за цену

Ключевые определения

Контекстное окно: максимальное общее количество входных и выходных токенов.
Throughput (скорость вывода): количество токенов в секунду, получаемых во время генерации токенов моделью.
Latency (задержка, время до первого токена): время до получения первого токена в секундах после отправки запроса к API.
Цена Output (вывода): цена за токен, сгенерированный моделью, выраженная в соответствующей валюте за миллион токенов.
Цена Input (ввода): цена за токен, включенный в запрос/сообщение, отправленное к API.