MWS

MWS

Единый API-доступ к лучшим AI-моделям

Цены указаны за 1 млн токенов, за генерацию 1 изображения или за 1 минуту входного аудио.

Модель ID Цена Input Цена Output Контекст Latency (сек) Throughput (т/сек) Квантизация Function
Calling
llama-3.3-70b-instruct meta-llama/llama-3.3-70b-instruct - ₽ - ₽ 128000 0.57 14.38 -
gpt-oss-20b openai/gpt-oss-20b - ₽ - ₽ 8192 0.8 72.67 -
gpt-oss-120b openai/gpt-oss-120b - ₽ - ₽ 131072 2.0 21.42 -

Ключевые определения

Контекстное окно: максимальное общее количество входных и выходных токенов.
Throughput (скорость вывода): количество токенов в секунду, получаемых во время генерации токенов моделью.
Latency (задержка, время до первого токена): время до получения первого токена в секундах после отправки запроса к API.
Цена Output (вывода): цена за токен, сгенерированный моделью, выраженная в соответствующей валюте за миллион токенов.
Цена Input (ввода): цена за токен, включенный в запрос/сообщение, отправленное к API.