gemini-2.5-flash

Google: Gemini 2.5 Flash

Google

Быстрый, эффективный «thinking» LLM из семейства Gemini 2.5 с гибким управлением уровня рассуждения (thinking budget), оптимизированный для широкого круга задач с большим объёмом данных, низкой задержкой и низкой стоимостью вычислений. Поддерживает текст, изображения, видео и аудио с очень большим контекстом (~1 млн токенов).

Начать работу

Чтобы сгенерировать ключ, авторизуйтесь и пополните баланс

Производительность

Количество параметров: -
Контекстное окно: 1048576
Latency: 0.5 сек
Throughput: 89.37 токенов/сек

Ценообразование за 1M токенов

Input: 23 ₽
Output: 191 ₽

Хронология

Дата релиза: 17.06.2025
Knowledge Cutoff: Январь 2025

Модальности

Input Text Image Audio Video
Output Text

Функциональные и технические возможности

Mixture of Experts
Vision
Fine-tuning
Function Calling
On-premise

Как получить доступ к gemini-2.5-flash по API

1

Пополните баланс и получите API-ключ

Войти в личный кабинет
2

Приступайте к работе

Используйте любой SDK, совместимый с OpenAI, чтобы встроить gemini-2.5-flash в ваше приложение.

Пример интеграции
import openai

client = openai.OpenAI(
    api_key="your-api-key",
    base_url="https://api.vsellm.ru/v1"
)

response = client.chat.completions.create(
    model="google/gemini-2.5-flash",
    messages=[
        {"role": "user", "content": "Привет!"}
    ]
)

print(response.choices[0].message.content)