Xiaomi: MiMo-V2-Flash
Xiaomi
Открытая языковая модель на архитектуре MoE с 309 млрд общих и 15 млрд активируемых параметров, использующая гибридное внимание и поддерживающая гибридный режим мышления с контекстом 256К токенов; демонстрирует SOTA-результаты среди открытых моделей в задачах программирования (SWE-bench Verified/Multilingual), обеспечивая производительность уровня Claude Sonnet 4.5 при существенно более низкой стоимости инференса.
Чтобы сгенерировать ключ, авторизуйтесь и пополните баланс
Производительность
Количество параметров:
-
Контекстное окно:
262144
Latency:
2.24 сек
Throughput:
42.22 токенов/сек
Ценообразование за 1M токенов
Input:
14 ₽
Output:
44 ₽
Хронология
Дата релиза:
-
Knowledge Cutoff:
-
Модальности
Input
Text
Output
Text
Функциональные и технические возможности
Mixture of Experts
Vision
Fine-tuning
Function Calling
On-premise
Как получить доступ к mimo-v2-flash по API
2
Приступайте к работе
Используйте любой SDK, совместимый с OpenAI, чтобы встроить mimo-v2-flash в ваше приложение.
Пример интеграции
import openai
client = openai.OpenAI(
api_key="your-api-key",
base_url="https://api.vsellm.ru/v1"
)
response = client.chat.completions.create(
model="xiaomi/mimo-v2-flash",
messages=[
{"role": "user", "content": "Привет!"}
]
)
print(response.choices[0].message.content)