MWS

Единый API-доступ к лучшим AI-моделям

Цены указаны за 1 млн токенов, за генерацию 1 изображения или за 1 минуту входного аудио.

Модель	ID	Цена Input	Цена Output	Контекст	Latency (сек)	Throughput (т/сек)	Квантизация
Meta: Llama 3.3 70B Instruct	meta-llama/llama-3.3-70b-instruct	- ₽	- ₽	128000	0.57	14.38	-
OpenAI: gpt-oss-20b	openai/gpt-oss-20b	- ₽	- ₽	8192	0.8	72.67	-
OpenAI: gpt-oss-120b	openai/gpt-oss-120b	- ₽	- ₽	131072	2.0	21.42	-

Цены указаны за 1 млн токенов, за генерацию 1 изображения или за 1 минуту входного аудио.

Организация	Модель / Алиас	Цена Input	Цена Output

Контекстное окно: максимальное общее количество входных и выходных токенов.

Throughput (скорость вывода): количество токенов в секунду, получаемых во время генерации токенов моделью.

Latency (задержка, время до первого токена): время до получения первого токена в секундах после отправки запроса к API.

Цена Output (вывода): цена за токен, сгенерированный моделью, выраженная в соответствующей валюте за миллион токенов.

Цена Input (ввода): цена за токен, включенный в запрос/сообщение, отправленное к API.