VSELLM

Единый API-доступ к лучшим AI-моделям

Передовые модели

Claude Sonnet 4.6

Высокоэффективная версия Claude 4.6, оптимизированная для скорости и низкой стоимости при хорошей производительности в кодировании и агентских задачах.

GPT-5 Нейросеть нового поколения

GPT-5

Флагманская языковая модель с продвинутыми возможностями рассуждения, программирования и анализа сложных контекстов.

Gemini 2.5 Pro Линейка Google DeepMind

Gemini 2.5 Pro

Мощная мультимодальная модель от Google, оптимизированная для сложных задач рассуждения, работы с кодом и анализа данных.

Чтобы сгенерировать ключ, авторизуйтесь и пополните баланс

Цены указаны за 1 млн токенов, за генерацию 1 изображения или за 1 минуту входного аудио.

Модель	ID	Цена Input	Цена Output	Контекст	Latency (сек)	Throughput (т/сек)
Anthropic: Claude Fable 5	anthropic/claude-fable-5	1105 ₽	5525 ₽	1000000	18.11	46.06
Qwen: Qwen3.5 Plus	qwen/qwen3.5-plus	18 ₽	105 ₽	1000000	8.71	77.06
Qwen: Qwen3.6 Flash	qwen/qwen3.6-flash	25 ₽	151 ₽	1000000	25.39	110.89
OpenAI: gpt-oss-20b	openai/gpt-oss-20b	5 ₽	21 ₽	131072	0.79	74.31
Qwen: Qwen3.5-Flash	qwen/qwen3.5-flash	4 ₽	44 ₽	1000000	19.77	119.89
Anthropic: Claude Opus 5	anthropic/claude-opus-5	552 ₽	2762 ₽	1000000	20.6	66.2
OpenAI: GPT-5.6 Luna	openai/gpt-5.6-luna	110 ₽	663 ₽	1050000	2.19	52.16
MoonshotAI: Kimi K3	moonshotai/kimi-k3	76 ₽	1658 ₽	1048576	8.73	18.32
OpenAI: GPT Chat Latest	openai/gpt-chat-latest	552 ₽	3315 ₽	1047576	2.25	12.89
OpenAI: GPT-5.5	openai/gpt-5.5	552 ₽	3315 ₽	1050000	2.7	25.62
Anthropic: Claude Opus 4.8	anthropic/claude-opus-4.8	552 ₽	2762 ₽	1000000	33.27	52.45
Google: Gemini 3.1 Pro Preview	google/gemini-3.1-pro-preview	221 ₽	1326 ₽	1048576	20.5	102.35
Google: Gemini 3.5 Flash Lite	google/gemini-3.5-flash-lite	33 ₽	276 ₽	1048576	1.14	80.99
OpenAI: GPT-5.4 Nano	openai/gpt-5.4-nano	22 ₽	138 ₽	400000	2.77	57.59
Google: Gemini 2.5 Flash	google/gemini-2.5-flash	33 ₽	276 ₽	1048576	1.11	29.26
OpenAI: GPT-5.6 Sol	openai/gpt-5.6-sol	552 ₽	3315 ₽	1050000	2.24	14.67
Anthropic: Claude Opus 4.7	anthropic/claude-opus-4.7	552 ₽	2762 ₽	1000000	10.36	3.04
OpenAI: GPT-5.6 Terra	openai/gpt-5.6-terra	276 ₽	1658 ₽	1050000	89.08	52.98
Qwen: Qwen3 VL 235B A22B Instruct	qwen/qwen3-vl-235b-a22b-instruct	44 ₽	175 ₽	128000	7.51	30.3
OpenAI: GPT-5	openai/gpt-5	138 ₽	1105 ₽	400000	73.97	20.62
Anthropic: Claude Sonnet 5	anthropic/claude-sonnet-5	221 ₽	1105 ₽	1000000	35.46	63.74
Meta: Llama 3.3 70B Instruct	meta-llama/llama-3.3-70b-instruct	17 ₽	49 ₽	131072	2.68	10.44
Qwen: Qwen3 235B A22B	qwen/qwen3-235b-a22b	44 ₽	175 ₽	128000	2.4	63.65
Xiaomi: MiMo-V2.5-Pro	xiaomi/mimo-v2.5-pro	67 ₽	133 ₽	1048576	11.21	51.55
Z.AI: GLM 4.6V Flash	z-ai/glm-4.6v-flash	1 ₽	8 ₽	128000	3.11	7.72
Google: Gemini 3 Flash Preview	google/gemini-3-flash-preview	55 ₽	332 ₽	1048576	4.29	46.84
MoonshotAI: Kimi K2.6	moonshotai/kimi-k2.6	137 ₽	568 ₽	256000	2.6	22.57
Qwen: Qwen3.6 Plus	qwen/qwen3.6-plus	42 ₽	253 ₽	1000000	5.65	42.96
Qwen: Qwen3 VL Flash	qwen/qwen3-vl-flash	3 ₽	33 ₽	256000	2.72	76.61
OpenAI: GPT-4o-mini	openai/gpt-4o-mini	17 ₽	66 ₽	128000	1.74	2.58
OpenAI: ChatGPT-4o	openai/chatgpt-4o-latest	552 ₽	1658 ₽	128000	1.98	21.67
OpenAI: GPT-5.2-Codex	openai/gpt-5.2-codex	193 ₽	1547 ₽	400000	1.84	15.93
Z.AI: GLM 5V Turbo	z-ai/glm-5v-turbo	133 ₽	442 ₽	202752	6.87	12.39
Z.AI: GLM 4.7	z-ai/glm-4.7	66 ₽	243 ₽	202752	29.46	26.62
Z.AI: GLM 5.1	z-ai/glm-5.1	126 ₽	505 ₽	202752	8.73	34.34
OpenAI: GPT-4.1 Nano	openai/gpt-4.1-nano	11 ₽	44 ₽	1047576	0.94	16.1
DeepSeek: DeepSeek V4 Flash	deepseek/deepseek-v4-flash	21 ₽	42 ₽	1000000	3.33	68.98
OpenAI: Text Embedding 3 Large	openai/text-embedding-3-large	16 ₽	- ₽	8192	8.71	0.0
Z.AI: GLM 5	z-ai/glm-5	110 ₽	354 ₽	202752	3.18	24.82
Google: Gemini 3.1 Flash Lite	google/gemini-3.1-flash-lite	28 ₽	166 ₽	1048576	1.1	11.85
Anthropic: Claude Haiku 4.5	anthropic/claude-haiku-4.5	110 ₽	552 ₽	200000	19.9	88.46
YandexGPT 5.1 Pro	yandex/gpt5.1-pro	1040 ₽	1040 ₽	32000	0.85	102.68
Anthropic: Claude Opus 4.6	anthropic/claude-opus-4.6	552 ₽	2762 ₽	1000000	13.78	37.17
Qwen: Qwen3 VL 235B A22B Thinking	qwen/qwen3-vl-235b-a22b-thinking	44 ₽	439 ₽	128000	5.36	46.97
OpenAI: GPT-5.1	openai/gpt-5.1	138 ₽	1105 ₽	400000	7.12	43.49
DeepSeek: DeepSeek V3.2	deepseek/deepseek-v3.2	44 ₽	66 ₽	128000	1.27	65.11
OpenAI: GPT-5.3-Codex	openai/gpt-5.3-codex	193 ₽	1547 ₽	400000	2.64	0.38
OpenAI: GPT-5 Mini	openai/gpt-5-mini	28 ₽	221 ₽	400000	24.06	101.52
OpenAI: GPT-5 Nano	openai/gpt-5-nano	6 ₽	44 ₽	400000	1.5	15.0
Anthropic: Claude Sonnet 4.5	anthropic/claude-sonnet-4.5	332 ₽	1658 ₽	1000000	9.99	12.81
Google: Gemini 3.6 Flash	google/gemini-3.6-flash	166 ₽	829 ₽	1048576	6.78	33.78
Z.AI: GLM 4.5 Air	z-ai/glm-4.5-air	20 ₽	130 ₽	131072	2.31	46.26
Qwen: Qwen3 Max Thinking	qwen/qwen3-max-thinking	55 ₽	219 ₽	256000	1.66	3.02
MoonshotAI: Kimi K2.5	moonshotai/kimi-k2.5	66 ₽	332 ₽	262144	38.42	28.7
DeepSeek: DeepSeek V4 Pro	deepseek/deepseek-v4-pro	252 ₽	505 ₽	1000000	26.74	52.09
Z.AI: GLM 4.6V FlashX	z-ai/glm-4.6v-flashx	6 ₽	61 ₽	128000	1.9	54.08
Z.AI: GLM 4.6V	z-ai/glm-4.6v	46 ₽	138 ₽	128000	4.88	11.89
Z.AI: GLM 4.7 Flash	z-ai/glm-4.7-flash	8 ₽	44 ₽	202752	151.26	42.56
Qwen: Qwen3 VL 30B A3B Thinking	qwen/qwen3-vl-30b-a3b-thinking	17 ₽	164 ₽	128000	2.13	88.99
Qwen: Qwen3.6 Max Preview	qwen/qwen3.6-max-preview	189 ₽	1136 ₽	256000	11.26	24.55
Google: Gemini 3.1 Pro Preview Custom Tools	google/gemini-3.1-pro-preview-customtools	221 ₽	1326 ₽	1048576	2.59	34.95
OpenAI: gpt-oss-120b	openai/gpt-oss-120b	17 ₽	66 ₽	131072	1.91	211.48
Google: Gemini 2.5 Pro	google/gemini-2.5-pro	138 ₽	1105 ₽	1048576	12.21	113.33
Xiaomi: MiMo-V2.5	xiaomi/mimo-v2.5	21 ₽	43 ₽	1048576	3.22	26.29
Qwen: Qwen3 VL 8B Thinking	qwen/qwen3-vl-8b-thinking	11 ₽	110 ₽	128000	2.71	121.62
Qwen: Qwen3 VL 30B A3B Instruct	qwen/qwen3-vl-30b-a3b-instruct	17 ₽	66 ₽	128000	1.3	72.8
Qwen: Qwen3.6-35B-A3B	qwen/qwen3.6-35b-a3b	38 ₽	227 ₽	256000	1.32	38.5
OpenAI: GPT-5.4 Pro	openai/gpt-5.4-pro	3315 ₽	19890 ₽	1050000	200.95	33.04
Anthropic: Claude Opus 4.1	anthropic/claude-opus-4.1	1658 ₽	8288 ₽	200000	1.88	30.66
OpenAI: GPT-5.2	openai/gpt-5.2	193 ₽	1547 ₽	400000	3.65	30.65
Qwen: Qwen3 Coder Next	qwen/qwen3-coder-next	22 ₽	89 ₽	256000	0.76	23.13
Qwen: Qwen3 VL 8B Instruct	qwen/qwen3-vl-8b-instruct	11 ₽	44 ₽	128000	1.93	70.58
Anthropic: Claude Opus 4.5	anthropic/claude-opus-4.5	552 ₽	2762 ₽	200000	2.45	11.32
Qwen: Qwen3.7 Max	qwen/qwen3.7-max	252 ₽	758 ₽	1000000	4.14	40.51
Z.AI: GLM 4.6	z-ai/glm-4.6	60 ₽	291 ₽	202752	12.81	20.61
DeepSeek: DeepSeek V3 0324	deepseek/deepseek-chat-v3-0324	38 ₽	153 ₽	163840	3.37	8.17
Google: Gemini 3.5 Flash	google/gemini-3.5-flash	166 ₽	995 ₽	1048576	1.57	57.75
Qwen: Qwen3.5 397B A17B	qwen/qwen3.5-397b-a17b	26 ₽	158 ₽	256000	5.85	58.79
DeepSeek-R1-Distill-Llama-70B	deepseek/deepseek-r1-distill-llama-70b	107 ₽	122 ₽	131072	8.41	18.67
YandexGPT 5 Pro	yandex/gpt5-pro	1560 ₽	1560 ₽	32000	0.75	45.85
YandexGPT 5 Lite	yandex/gpt5-lite	260 ₽	260 ₽	32000	4.13	75.29
OpenAI: GPT-5.4	openai/gpt-5.4	276 ₽	1658 ₽	1050000	2.98	24.18
Z.AI: GLM 5.2	z-ai/glm-5.2	155 ₽	486 ₽	1000000	3.35	31.95
OpenAI: GPT-4.1	openai/gpt-4.1	221 ₽	884 ₽	1047576	2.93	18.4
OpenAI: GPT-5.4 Mini	openai/gpt-5.4-mini	83 ₽	497 ₽	400000	1.51	70.38
Anthropic: Claude Sonnet 4.6	anthropic/claude-sonnet-4.6	332 ₽	1658 ₽	1000000	7.89	14.96
OpenAI: GPT-4.1 Mini	openai/gpt-4.1-mini	44 ₽	177 ₽	1047576	2.31	61.48
Qwen: Qwen3.7 Plus	qwen/qwen3.7-plus	35 ₽	141 ₽	1000000	29.14	50.35
MoonshotAI: Kimi K2.7 Code	moonshotai/kimi-k2.7-code	105 ₽	442 ₽	262144	0.86	56.23
DeepSeek: DeepSeek V3.2 Speciale	deepseek/deepseek-v3.2-speciale	61 ₽	184 ₽	163840	1.88	73.34
Qwen: Qwen3 VL Plus	qwen/qwen3-vl-plus	22 ₽	219 ₽	256000	0.86	11.61

Цены указаны за 1 млн токенов, за генерацию 1 изображения или за 1 минуту входного аудио.

Модель	ID	Цена Input	Цена
OpenAI: GPT Image 2	openai/gpt-image-2		1.02 ₽
Google: Nano Banana 2 (Gemini 3.1 Flash Image)	google/gemini-3.1-flash-image		7.49 ₽
Google: Gemini 3.1 Flash Lite Image	google/gemini-3.1-flash-lite-image		3.71 ₽
Google: Gemini 2.5 Flash Image	google/gemini-2.5-flash-image		4.31 ₽
Google: Gemini Embedding 001	google/gemini-embedding-001	17 ₽	- ₽
Google: Nano Banana Pro (Gemini 3 Pro Image)	google/gemini-3-pro-image		14.92 ₽
Imagen 4.0 Fast Generate 001	vertex_ai/imagen-4.0-fast-generate-001		1.53 ₽
Imagen 4.0 Generate 001	vertex_ai/imagen-4.0-generate-001		3.06 ₽
Imagen 4.0 Ultra Generate 001	vertex_ai/imagen-4.0-ultra-generate-001		4.59 ₽
OpenAI: GPT Image 1 Mini	openai/gpt-image-1-mini		0.94 ₽
OpenAI: Text Embedding 3 Small	openai/text-embedding-3-small	2 ₽	- ₽
OpenAI: GPT Image 1	openai/gpt-image-1		4.67 ₽
Qwen: Qwen3 Embedding 4B	qwen/qwen3-embedding-4b	3 ₽	- ₽
Qwen: Qwen3 Embedding 8B	qwen/qwen3-embedding-8b	2 ₽	- ₽

Скорость vs Цена Output

Оптимальное соотношение скорость/цена

Контекст vs Цена Output

Модели с лучшим контекстом за цену

Ключевые определения

Контекстное окно: максимальное общее количество входных и выходных токенов.

Throughput (скорость вывода): количество токенов в секунду, получаемых во время генерации токенов моделью.

Latency (задержка, время до первого токена): время до получения первого токена в секундах после отправки запроса к API.

Цена Output (вывода): цена за токен, сгенерированный моделью, выраженная в соответствующей валюте за миллион токенов.

Цена Input (ввода): цена за токен, включенный в запрос/сообщение, отправленное к API.