Google: Gemini 2.5 Flash
Быстрый, эффективный «thinking» LLM из семейства Gemini 2.5 с гибким управлением уровня рассуждения (thinking budget), оптимизированный для широкого круга задач с большим объёмом данных, низкой задержкой и низкой стоимостью вычислений. Поддерживает текст, изображения, видео и аудио с очень большим контекстом (~1 млн токенов).
Чтобы сгенерировать ключ, авторизуйтесь и пополните баланс
Производительность
Количество параметров:
-
Контекстное окно:
1048576
Latency:
0.5 сек
Throughput:
89.37 токенов/сек
Ценообразование за 1M токенов
Input:
23 ₽
Output:
191 ₽
Хронология
Дата релиза:
17.06.2025
Knowledge Cutoff:
Январь 2025
Модальности
Input
Text
Image
Audio
Video
Output
Text
Функциональные и технические возможности
Mixture of Experts
Vision
Fine-tuning
Function Calling
On-premise
Как получить доступ к gemini-2.5-flash по API
2
Приступайте к работе
Используйте любой SDK, совместимый с OpenAI, чтобы встроить gemini-2.5-flash в ваше приложение.
Пример интеграции
import openai
client = openai.OpenAI(
api_key="your-api-key",
base_url="https://api.vsellm.ru/v1"
)
response = client.chat.completions.create(
model="google/gemini-2.5-flash",
messages=[
{"role": "user", "content": "Привет!"}
]
)
print(response.choices[0].message.content)