MWS
Единый API-доступ к лучшим AI-моделям
Цены указаны за 1 млн токенов, за генерацию 1 изображения или за 1 минуту входного аудио.
| Модель | ID | Цена Input | Цена Output | Контекст | Latency (сек) | Throughput (т/сек) | Квантизация | Function Calling |
|---|---|---|---|---|---|---|---|---|
|
|
meta-llama/llama-3.3-70b-instruct | - ₽ | - ₽ | 128000 | 0.57 | 14.38 | - | |
|
openai/gpt-oss-20b | - ₽ | - ₽ | 8192 | 0.8 | 72.67 | - | |
|
openai/gpt-oss-120b | - ₽ | - ₽ | 131072 | 2.0 | 21.42 | - |
Ключевые определения
Контекстное окно:
максимальное общее количество входных и выходных токенов.
Throughput (скорость вывода):
количество токенов в секунду, получаемых во время генерации токенов моделью.
Latency (задержка, время до первого токена):
время до получения первого токена в секундах после отправки запроса к API.
Цена Output (вывода):
цена за токен, сгенерированный моделью, выраженная в соответствующей валюте за миллион токенов.
Цена Input (ввода):
цена за токен, включенный в запрос/сообщение, отправленное к API.