VSELLM

VSELLM

Единый API-доступ к лучшим AI-моделям

Передовые модели

Claude Sonnet 4.6

Высокоэффективная версия Claude 4.6, оптимизированная для скорости и низкой стоимости при хорошей производительности в кодировании и агентских задачах.

GPT-5

Флагманская языковая модель с продвинутыми возможностями рассуждения, программирования и анализа сложных контекстов.

Gemini 2.5 Pro

Мощная мультимодальная модель от Google, оптимизированная для сложных задач рассуждения, работы с кодом и анализа данных.

Чтобы сгенерировать ключ, авторизуйтесь и пополните баланс

Цены указаны за 1 млн токенов, за генерацию 1 изображения или за 1 минуту входного аудио.

Модель ID Цена Input Цена Output Контекст Latency (сек) Throughput (т/сек) Квантизация Function
Calling
Подключение
glm-4.7 z-ai/glm-4.7 58 ₽ 303 ₽ 202752 14.47 93.2 -
gpt5-pro yandex/gpt5-pro 1200 ₽ 1200 ₽ 32000 1.25 45.02 -
gpt-5 openai/gpt-5 96 ₽ 765 ₽ 400000 8.7 35.51 -
gpt-4.1 openai/gpt-4.1 153 ₽ 612 ₽ 1047576 0.88 66.2 -
qwen3-coder-next qwen/qwen3-coder-next 26 ₽ 128 ₽ 256000 2.18 148.43 -
glm-4.6v-flashx z-ai/glm-4.6v-flashx 6 ₽ 61 ₽ 128000 4.72 109.9 -
glm-4.6v z-ai/glm-4.6v 46 ₽ 138 ₽ 128000 20.69 23.87 -
gpt-5.1-chat openai/gpt-5.1-chat 96 ₽ 765 ₽ 128000 1.36 141.1 -
glm-4.6v-flash z-ai/glm-4.6v-flash 1 ₽ 8 ₽ 128000 13.05 58.52 -
gpt-5.1 openai/gpt-5.1 96 ₽ 765 ₽ 400000 5.2 44.48 -
gemini-3-pro-preview google/gemini-3-pro-preview 153 ₽ 918 ₽ 1048576 4.03 60.77 -
qwen3-vl-30b-a3b-thinking qwen/qwen3-vl-30b-a3b-thinking 24 ₽ 122 ₽ 128000 7.54 260.88 -
glm-4.5-air z-ai/glm-4.5-air 20 ₽ 130 ₽ 131072 3.78 67.98 -
kimi-k2.5 moonshotai/kimi-k2.5 92 ₽ 459 ₽ 262144 20.8 36.21 -
qwen3-vl-flash qwen/qwen3-vl-flash 8 ₽ 61 ₽ 256000 4.08 126.36 -
qwen3-vl-8b-instruct qwen/qwen3-vl-8b-instruct 12 ₽ 76 ₽ 128000 1.38 78.83 -
qwen3-max-thinking qwen/qwen3-max-thinking 102 ₽ 510 ₽ 256000 3.2 33.27 -
o3-deep-research openai/o3-deep-research 1530 ₽ 6120 ₽ 200000 0.0 0.0 -
gpt-5.3-codex openai/gpt-5.3-codex 134 ₽ 1071 ₽ 400000 6.45 42.38 -
gpt-5-mini openai/gpt-5-mini 19 ₽ 153 ₽ 400000 6.82 48.84 -
gpt-5.2-codex openai/gpt-5.2-codex 134 ₽ 1071 ₽ 400000 7.03 38.01 -
gpt-oss-120b openai/gpt-oss-120b 1 ₽ 29 ₽ 131072 0.45 280.7 FP4/FP8/BF16
gemini-2.5-pro google/gemini-2.5-pro 96 ₽ 765 ₽ 1048576 2.62 85.1 -
gpt-5-nano openai/gpt-5-nano 4 ₽ 31 ₽ 400000 2.4 50.21 -
claude-sonnet-4 anthropic/claude-sonnet-4 459 ₽ 2295 ₽ 1000000 2.75 57.69 -
gpt-4.1-nano openai/gpt-4.1-nano 8 ₽ 31 ₽ 1047576 0.8 67.31 -
gpt-5.2-chat openai/gpt-5.2-chat 134 ₽ 1071 ₽ 128000 1.98 91.13 -
glm-5 z-ai/glm-5 122 ₽ 392 ₽ 202752 12.36 41.92 -
gpt-4.1-mini openai/gpt-4.1-mini 31 ₽ 122 ₽ 1047576 0.84 56.47 -
gpt-oss-20b openai/gpt-oss-20b 5 ₽ 21 ₽ 131072 0.4 205.4 FP4/FP8
gpt-5-chat openai/gpt-5-chat 96 ₽ 765 ₽ 128000 0.56 59.23 -
qwen3-vl-plus qwen/qwen3-vl-plus 17 ₽ 136 ₽ 256000 14.26 32.59 -
chatgpt-4o-latest openai/chatgpt-4o-latest 382 ₽ 1148 ₽ 128000 0.55 97.31 -
claude-sonnet-4.6 anthropic/claude-sonnet-4.6 459 ₽ 2295 ₽ 1000000 14.01 35.1 -
kimi-k2-0905 moonshotai/kimi-k2-0905 92 ₽ 382 ₽ 262144 30.13 11.05 -
gemini-2.5-flash google/gemini-2.5-flash 23 ₽ 191 ₽ 1048576 0.5 89.37 -
deepseek-v3.2-speciale deepseek/deepseek-v3.2-speciale 44 ₽ 129 ₽ 163840 0.78 41.67 -
gemini-3-flash-preview google/gemini-3-flash-preview 38 ₽ 230 ₽ 1048576 1.59 73.55 -
kimi-k2-thinking moonshotai/kimi-k2-thinking 46 ₽ 191 ₽ 262144 9.93 77.77 -
deepseek-r1-distill-llama-70b deepseek/deepseek-r1-distill-llama-70b 107 ₽ 122 ₽ 131072 0.47 114.8 FP8/BF16
deepseek-v3.2 deepseek/deepseek-v3.2 44 ₽ 129 ₽ 163840 1.55 59.81 -
gpt-4o-mini openai/gpt-4o-mini 11 ₽ 46 ₽ 128000 0.54 59.7 -
qwen3-vl-235b-a22b-thinking qwen/qwen3-vl-235b-a22b-thinking 46 ₽ 184 ₽ 128000 28.84 89.69 -
qwen3-vl-8b-thinking qwen/qwen3-vl-8b-thinking 18 ₽ 209 ₽ 128000 0.95 80.34 -
claude-opus-4.6 anthropic/claude-opus-4.6 765 ₽ 3825 ₽ 1000000 13.48 37.5 -
qwen3.5-plus qwen/qwen3.5-plus 34 ₽ 204 ₽ 1000000 2.02 80.23 -
qwen3-vl-30b-a3b-instruct qwen/qwen3-vl-30b-a3b-instruct 20 ₽ 80 ₽ 128000 1.26 77.36 -
qwen3-vl-235b-a22b-instruct qwen/qwen3-vl-235b-a22b-instruct 31 ₽ 135 ₽ 128000 1.21 45.32 -
claude-haiku-4.5 anthropic/claude-haiku-4.5 153 ₽ 765 ₽ 200000 1.06 94.93 -
gpt5-lite yandex/gpt5-lite 200 ₽ 200 ₽ 32000 1.18 96.87 -
gpt5.1-pro yandex/gpt5.1-pro 400 ₽ 400 ₽ 32000 11.35 92.2 -
gpt-5.2 openai/gpt-5.2 134 ₽ 1071 ₽ 400000 5.01 40.18 -
glm-4.6 z-ai/glm-4.6 60 ₽ 291 ₽ 202752 5.66 48.87 -
gemini-3.1-flash-lite-preview google/gemini-3.1-flash-lite-preview 19 ₽ 115 ₽ 1048576 3.09 310.65 -
GigaChat-2-Max GigaChat/GigaChat-2-Max 570 ₽ 570 ₽ 131072 10.86 11.7 -
qwen3.5-397b-a17b qwen/qwen3.5-397b-a17b 47 ₽ 298 ₽ 256000 3.38 83.4 -
claude-opus-4.1 anthropic/claude-opus-4.1 2295 ₽ 11475 ₽ 200000 1.88 30.66 -
deepseek-chat-v3-0324 deepseek/deepseek-chat-v3-0324 29 ₽ 133 ₽ 163840 0.53 24.27 -
claude-opus-4.5 anthropic/claude-opus-4.5 765 ₽ 3825 ₽ 200000 2.96 59.58 -
gpt-5.4 openai/gpt-5.4 191 ₽ 1148 ₽ 1050000 1.86 30.8 -
llama-3.3-70b-instruct meta-llama/llama-3.3-70b-instruct 17 ₽ 49 ₽ 131072 0.47 74.7 FP8/FP16/BF16
gemini-3.1-pro-preview google/gemini-3.1-pro-preview 153 ₽ 918 ₽ 1048576 17.62 33.37 -
claude-sonnet-4.5 anthropic/claude-sonnet-4.5 459 ₽ 2295 ₽ 1000000 2.38 58.96 -
grok-code-fast-1 x-ai/grok-code-fast-1 15 ₽ 115 ₽ 256000 1.32 82.2 -
gpt-5.3-chat openai/gpt-5.3-chat 134 ₽ 1071 ₽ 128000 1.44 63.81 -
qwen3.5-flash qwen/qwen3.5-flash 8 ₽ 34 ₽ 1000000 1.38 170.94 -
T-pro-it-2.0 t-tech/T-pro-it-2.0 27 ₽ 53 ₽ 32768 1.56 73.75 BF16
qwen3-235b-a22b qwen/qwen3-235b-a22b 31 ₽ 92 ₽ 128000 1.13 56.81 FP8/BF16

Скорость vs Цена Output

Оптимальное соотношение скорость/цена

Контекст vs Цена Output

Модели с лучшим контекстом за цену

Ключевые определения

Контекстное окно: максимальное общее количество входных и выходных токенов.
Throughput (скорость вывода): количество токенов в секунду, получаемых во время генерации токенов моделью.
Latency (задержка, время до первого токена): время до получения первого токена в секундах после отправки запроса к API.
Цена Output (вывода): цена за токен, сгенерированный моделью, выраженная в соответствующей валюте за миллион токенов.
Цена Input (ввода): цена за токен, включенный в запрос/сообщение, отправленное к API.