Provider Icon

VSELLM

Общая информация

Лучший LLM Arena Score:
Лучший Latency:
Лучший Throughput:
Лучшее Цена/Качество:
Icon gpt-5 gpt-5
Icon gpt-oss-20b gpt-oss-20b
Icon gemini-2.5-flash-i.. gemini-2.5-flash-image
Icon gpt-4.1-mini gpt-4.1-mini

Модели провайдера

Быстрые фильтры:
Фильтры:
Модель ID Цена Input Цена Output Контекст Latency (сек) Throughput (т/сек) Квантизация Function Calling
gpt5-lite YandexGPT 5 Lite yandex/gpt5-lite 200 ₽ 200 ₽ 32000 1.18 96.87 -
claude-sonnet-4 Anthropic: Claude Sonnet 4 anthropic/claude-sonnet-4 230 ₽ 1148 ₽ 1000000 2.75 57.69 -
gpt-5 OpenAI: GPT-5 openai/gpt-5 96 ₽ 765 ₽ 400000 8.7 35.51 -
gpt-4.1 OpenAI: GPT-4.1 openai/gpt-4.1 153 ₽ 612 ₽ 1047576 0.88 66.2 -
claude-sonnet-4.5 Anthropic: Claude Sonnet 4.5 anthropic/claude-sonnet-4.5 230 ₽ 1148 ₽ 1000000 2.38 58.96 -
deepseek-chat-v3-0324 DeepSeek: DeepSeek V3 0324 deepseek/deepseek-chat-v3-0324 37 ₽ 129 ₽ 163840 0.53 24.27 -
gpt-oss-20b OpenAI: gpt-oss-20b openai/gpt-oss-20b 6 ₽ 23 ₽ 131072 0.4 205.4 FP4/FP8
T-pro-it-2.0 T-pro-it-2.0 t-tech/T-pro-it-2.0 85 ₽ 170 ₽ 32768 1.56 73.75 BF16
gpt-oss-120b OpenAI: gpt-oss-120b openai/gpt-oss-120b 6 ₽ 31 ₽ 131072 0.45 280.7 FP4/FP8/BF16
gemini-2.5-flash Google: Gemini 2.5 Flash google/gemini-2.5-flash 23 ₽ 191 ₽ 1048576 0.5 89.37 -
GigaChat-2-Max GigaChat-2-Max GigaChat/GigaChat-2-Max 1950 ₽ 1950 ₽ 131072 10.86 11.7 -
qwen3-235b-a22b Qwen: Qwen3 235B A22B qwen/qwen3-235b-a22b 28 ₽ 83 ₽ 40960 1.13 56.81 FP8/BF16
gpt-4o-mini OpenAI: GPT-4o-mini openai/gpt-4o-mini 11 ₽ 46 ₽ 128000 0.54 59.7 -
gemini-2.5-pro Google: Gemini 2.5 Pro google/gemini-2.5-pro 96 ₽ 765 ₽ 1048576 2.62 85.1 -
grok-code-fast-1 xAI: Grok Code Fast 1 x-ai/grok-code-fast-1 31 ₽ 230 ₽ 256000 1.32 82.2 -
chatgpt-4o-latest OpenAI: ChatGPT-4o openai/chatgpt-4o-latest 382 ₽ 1148 ₽ 128000 0.55 97.31 -
gpt5-pro YandexGPT 5 Pro yandex/gpt5-pro 1200 ₽ 1200 ₽ 32000 1.25 45.02 -
gpt-4.1-nano OpenAI: GPT-4.1 Nano openai/gpt-4.1-nano 8 ₽ 31 ₽ 1047576 0.8 67.31 -
gpt-4.1-mini OpenAI: GPT-4.1 Mini openai/gpt-4.1-mini 31 ₽ 122 ₽ 1047576 0.84 56.47 -
llama-3.3-70b-instruct Meta: Llama 3.3 70B Instruct meta-llama/llama-3.3-70b-instruct 20 ₽ 60 ₽ 131072 0.47 74.7 FP8/FP16/BF16
imagen-4.0-fast-generate-001 Imagen 4.0 Fast Generate 001 vertex_ai/imagen-4.0-fast-generate-001 - ₽ 2 ₽ - 0.0 0.0 -
imagen-3.0-generate-002 Imagen 3.0 Generate 002 vertex_ai/imagen-3.0-generate-002 - ₽ 3 ₽ - 0.0 0.0 -
imagen-4.0-generate-001 Imagen 4.0 Generate 001 vertex_ai/imagen-4.0-generate-001 - ₽ 3 ₽ - 0.0 0.0 -
imagen-4.0-ultra-generate-001 Imagen 4.0 Ultra Generate 001 vertex_ai/imagen-4.0-ultra-generate-001 - ₽ 5 ₽ - 0.0 0.0 -
glm-4.5-air Z.AI: GLM 4.5 Air z-ai/glm-4.5-air 16 ₽ 104 ₽ 131072 3.78 67.98 -
gemini-2.5-flash-image Google: Gemini 2.5 Flash Image google/gemini-2.5-flash-image 23 ₽ 191 ₽ 32768 6.7 1037.0 -
gpt-5.1-chat OpenAI: GPT-5.1 Chat openai/gpt-5.1-chat 96 ₽ 765 ₽ 128000 1.36 141.1 -
gpt-5-chat OpenAI: GPT-5 Chat openai/gpt-5-chat 96 ₽ 765 ₽ 128000 0.56 59.23 -
gemini-3-pro-image-preview Google: Nano Banana Pro (Gemini 3 Pro Image Preview) google/gemini-3-pro-image-preview 153 ₽ 918 ₽ 65536 16.44 31.7 -
gpt-image-1-mini OpenAI: GPT Image 1 Mini openai/gpt-image-1-mini 191 ₽ 612 ₽ - 0.0 0.0 -
gpt-5.1 OpenAI: GPT-5.1 openai/gpt-5.1 96 ₽ 765 ₽ 400000 5.2 44.48 -
gpt-image-1 OpenAI: GPT Image 1 openai/gpt-image-1 765 ₽ 3060 ₽ - 0.0 0.0 -
claude-opus-4.5 Anthropic: Claude Opus 4.5 anthropic/claude-opus-4.5 382 ₽ 1912 ₽ 200000 2.96 59.58 -
claude-opus-4.1 Anthropic: Claude Opus 4.1 anthropic/claude-opus-4.1 1148 ₽ 5738 ₽ 200000 1.88 30.66 -
imagen-3.0-generate-001 Imagen 3.0 Generate 001 vertex_ai/imagen-3.0-generate-001 - ₽ 3 ₽ - 0.0 0.0 -
imagen-3.0-fast-generate-001 Imagen 3.0 Fast Generate 001 vertex_ai/imagen-3.0-fast-generate-001 - ₽ - ₽ - 0.0 0.0 -
text-embedding-3-small OpenAI: Text Embedding 3 Small openai/text-embedding-3-small 3 ₽ - ₽ 8192 0.78 0.0 -
text-embedding-3-large OpenAI: Text Embedding 3 Large openai/text-embedding-3-large 20 ₽ - ₽ 8192 8.71 0.0 -
gemini-embedding-001 Google: Gemini Embedding 001 google/gemini-embedding-001 23 ₽ - ₽ 20000 0.0 0.0 -
kimi-k2-thinking MoonshotAI: Kimi K2 Thinking moonshotai/kimi-k2-thinking 69 ₽ 360 ₽ 262144 9.93 77.77 -
gpt-5-nano OpenAI: GPT-5 Nano openai/gpt-5-nano 4 ₽ 31 ₽ 400000 2.4 50.21 -
deepseek-r1-distill-llama-70b DeepSeek-R1-Distill-Llama-70B deepseek/deepseek-r1-distill-llama-70b 5 ₽ 20 ₽ 131072 0.47 114.8 FP8/BF16
gpt-5-mini OpenAI: GPT-5 Mini openai/gpt-5-mini 19 ₽ 153 ₽ 400000 6.82 48.84 -
gpt5.1-pro YandexGPT 5.1 Pro yandex/gpt5.1-pro 400 ₽ 400 ₽ 32000 11.35 92.2 -
claude-haiku-4.5 Anthropic: Claude Haiku 4.5 anthropic/claude-haiku-4.5 76 ₽ 382 ₽ 200000 1.06 94.93 -
gemini-3-pro-preview Google: Gemini 3 Pro Preview google/gemini-3-pro-preview 153 ₽ 918 ₽ 1048576 4.03 60.77 -
sora-2 OpenAI: Sora 2 openai/sora-2 - ₽ - ₽ - 0.0 0.0 -
glm-4.6 Z.AI: GLM 4.6 z-ai/glm-4.6 61 ₽ 268 ₽ 202752 5.66 48.87 -
kimi-k2-0905 MoonshotAI: Kimi K2 0905 moonshotai/kimi-k2-0905 60 ₽ 291 ₽ 262144 5.38 95.08 -

Цена vs Качество

Лучшее соотношение цена/качество

Качество vs Скорость (Throughput)

Лучшее соотношение качество/скорость

Качество vs Latency

Лучшее соотношение качество/Latency

Ключевые определения

Контекстное окно: максимальное общее количество входных и выходных токенов.

Throughput (скорость вывода): количество токенов в секунду, получаемых во время генерации токенов моделью (т.е. после получения первого фрагмента от API для моделей, поддерживающих потоковую передачу).

Latency (задержка, время до первого токена): время до получения первого токена в секундах после отправки запроса к API. Для моделей, использующих общие токены для рассуждений, это будет первый токен рассуждения. Для моделей, не поддерживающих потоковую передачу, это время до получения полного ответа.

Цена аутпута (вывода): цена за токен, сгенерированный моделью (полученный от API), выраженная в соответствующей валюте за миллион токенов.

Цена инпута (ввода): цена за токен, включенный в запрос/сообщение, отправленное к API, выраженная в соответствующей валюте за миллион токенов.

← Назад к моделям