mimo-v2-flash

Xiaomi: MiMo-V2-Flash

Xiaomi

Открытая языковая модель на архитектуре MoE с 309 млрд общих и 15 млрд активируемых параметров, использующая гибридное внимание и поддерживающая гибридный режим мышления с контекстом 256К токенов; демонстрирует SOTA-результаты среди открытых моделей в задачах программирования (SWE-bench Verified/Multilingual), обеспечивая производительность уровня Claude Sonnet 4.5 при существенно более низкой стоимости инференса.

Начать работу

Чтобы сгенерировать ключ, авторизуйтесь и пополните баланс

Производительность

Количество параметров: -
Контекстное окно: 262144
Latency: 2.24 сек
Throughput: 42.22 токенов/сек

Ценообразование за 1M токенов

Input: 14 ₽
Output: 44 ₽

Хронология

Дата релиза: -
Knowledge Cutoff: -

Модальности

Input Text
Output Text

Функциональные и технические возможности

Mixture of Experts
Vision
Fine-tuning
Function Calling
On-premise

Как получить доступ к mimo-v2-flash по API

1

Пополните баланс и получите API-ключ

Войти в личный кабинет
2

Приступайте к работе

Используйте любой SDK, совместимый с OpenAI, чтобы встроить mimo-v2-flash в ваше приложение.

Пример интеграции
import openai

client = openai.OpenAI(
    api_key="your-api-key",
    base_url="https://api.vsellm.ru/v1"
)

response = client.chat.completions.create(
    model="xiaomi/mimo-v2-flash",
    messages=[
        {"role": "user", "content": "Привет!"}
    ]
)

print(response.choices[0].message.content)