Единый API к лучшим AI-моделям

Получите стабильный доступ к 100+ моделям (OpenAI, Anthropic, Google) без VPN

api.vsellm.ru/vi /chat/completions |
Экономно: Цены ниже официальных провайдеров
Официально в РФ: Работаем по договору
Удобно: Оплата в рублях картой или счётом
Безопасно: Zero-log policy
Прозрачно: Все расходы в дашборде

Широкая линейка актуальных
моделей

Цены указаны за 1 млн токенов, за генерацию 1 изображения или за 1 минуту входного аудио.

Генерация изображений и мультимодальные модели

Создавайте визуальный контент студийного качества с SOTA-моделями: от фотореалистичных Imagen 4 до новейших Nano Banana Pro. Выбирайте модель с оплатой за генерацию или за токены.

Generated image
Google
Nano Banana Pro (Gemini 3 Pro Image)
Та самая модель, которую все ищут.
Для чего: Сложные креативные задачи, понимание длинных промптов.
~153 ₽ за 1М входных токенов
Выгода: Дешевле OpenRouter на 10%
Generated image
Vertex AI
Imagen 4.0 (Ultra & Fast)
Новый стандарт фотореализма от Google.
Для чего: Маркетинговые материалы, высокая детализация текста на картинке.
от 1.53 ₽ за генерацию (Fast)
Выгода: Фикс за изображение
Generated image
OpenAI
GPT-Image-1 Mini
Эволюция DALL-E для быстрой генерации.
Для чего: Быстрые превью, стилизация, интеграция с экосистемой OpenAI.
~191 ₽ за 1М входных токенов
Выгода: Дешевле OpenRouter на 10%

Текстовые модели (LLM) для бизнеса и разработки

Подключайте API для чат-ботов, RAG-систем, анализа документов, саммаризации и кодинга. Мы поддерживаем оригинальные параметры моделей. Если модель поддерживает Vision или JSON Mode у провайдера — она поддерживает это и через наш API.

OpenAI
GPT-5 (Latest)
Новый эталон интеллектуальных систем от топового провайдера.
Для чего: Сложная логика, reasoning, решение многоступенчатых задач, креатив высшего уровня.
95.63 ₽ за 1М токенов
Выгода: Дешевле OpenAI на 10%
Anthropic
Claude Sonnet 4.5
Главный конкурент GPT-5 в написании кода.
Для чего: Разработка ПО, анализ больших объемов данных (Big Data), написание статей с человеческой интонацией.
229.50 ₽ за 1М токенов
Выгода: Дешевле Anthropic на 10%
OpenAI
GPT-4.1 Nano
Самая доступная модель для высоконагруженных систем.
Для чего: Классификация текстов, быстрые ответы в поддержке, саммаризация, простые функции.
7.65 ₽ за 1М токенов
Выгода: Выгоднее всех аналогов

Модели эмбеддингов для RAG и поиска

Превращайте текст в векторы для семантического поиска, классификации и рекомендательных систем. Необходимый компонент для работы с вашей базой знаний.

OpenAI
Text Embedding 3 Small
Самая популярная модель для базовых задач.
Для чего: Быстрый поиск и семантическое сопоставление, RAG-системы, работа с большими объёмами данных, где критичны скорость отклика и масштабируемость.
3.06 ₽ за 1М токенов
Преимущество: Сверхнизкая цена при высоком качестве
OpenAI
Text Embedding 3 Large
Максимальная точность векторизации данных.
Для чего: Сложные семантические задачи, мультиязычный поиск, работа с нюансами смысла. Поддерживает сокращение размерности.
19.89 ₽ за 1М токенов
Преимущество: Лучшее понимание русского языка
Google
Gemini Embedding 001
Альтернативный вариант для экосистемы Google.
Для чего: Задачи, требующие расширенного контекста или специфической токенизации от Google. Контекст больше, чем у OpenAI.
22.95 ₽ за 1М токенов
Преимущество: Увеличенное контекстное окно

Транскрибация аудио (Speech-to-text)

Превращайте голос в текст с высокой точностью. Поддержка русского языка, автоматическая расстановка пунктуации.

OpenAI
Whisper-1
SOTA-стандарт распознавания речи.
Для чего: Расшифровка совещаний, голосовое управление, телеграм-боты, субтитры для видео.
99 языков Автоопределение языка Шумоподавление
0.92 ₽ за минуту аудио-инпута

Почему разработчики выбирают VseLLM?

Единый API-доступ к лучшим языковым моделям с гарантией uptime и прозрачным ценообразованием

Один интерфейс для любой задачи

Доступ ко всем SOTA-моделям через единый шлюз. OpenAI Compatible — ваш код заработает сразу, просто смените base_url. Не нужно изучать документацию десятка разных провайдеров.

Получить API-ключ

Балансировка нагрузки

Система авто-фоллбэка перенаправит запрос через резервный канал, если основной провайдер недоступен. Ваш продакшн не остановится.

Смотреть все модели

B2B без боли и криптовалют

Работаем в белую. Единый счёт в рублях. Автоматически формируем закрывающие документы (акты, инвойсы) и отправляем через ЭДО (Контур.Диадок). Никаких рисков блокировок аккаунтов.

Политика Zero-Logging

Мы понимаем важность NDA. VseLLM не сохраняет тексты ваших промптов и ответов моделей на наших серверах. Ваши данные принадлежат только вам.

Получить API-ключ

Прозрачный биллинг

Считайте юнит-экономику легко. Мы привели все цены к единому стандарту: LLM — за 1 млн токенов, изображения — за генерацию, аудио — за минуту. Никаких скрытых формул.

Смотреть все модели

Контроль расходов

Следите за потреблением в реальном времени. В личном кабинете доступен дашборд с детализацией по каждому запросу. Вы всегда видите, на что уходит бюджет.

Получить API-ключ
n8n

Сервер n8n в подарок

Для всех клиентов VseLLM с ненулевым балансом — enterprise-сервер n8n. Стройте AI-агентов и no-code автоматизации с нашими моделями сразу «из коробки».

Войти

Быстрый старт

1

Создайте аккаунт

Зарегистрируйтесь через Telegram-бота или кнопку «Войти» на сайте.

2

Получите API-ключ

В личном кабинете перейдите в раздел «Ключи» и сгенерируйте новый ключ.

Ключ показывается один раз — сохраните его сразу
3

Установите библиотеку

Используйте официальный Python SDK или любую OpenAI-совместимую библиотеку.

$ pip install openai
4

Начните работу

Просто замените base_url на наш эндпоинт — ваш код заработает сразу.

from openai import OpenAI

client = OpenAI(
    api_key="vsellm_xxx",
    base_url="https://api.vsellm.ru/v1"
)

response = client.chat.completions.create(
    model="gpt-4o",
    messages=[{"role": "user", "content": "Hello!"}]
)
print(response.choices[0].message.content)

FAQ

Как создать API-ключ?

Для создания ключа авторизуйтесь на сайте, нажав кнопку «Войти» в правом верхнем углу. Проверьте ваш баланс во вкладке «Баланс», он должен быть не нулевым. Во вкладке «Ключи» нажмите кнопку «Добавить ключ». Обязательно скопируйте и сохраните его сразу после генерации, так как в целях безопасности мы показываем ключ только один раз.

Как оплатить по счёту (для юрлиц)?

Напишите в чат поддержки, на почту или . Мы выставим счёт через ЭДО (Диадок), а в конце отчётного периода предоставим закрывающие документы (акты).

Где мой API-ключ? Я закрыл окно и не скопировал.

Согласно политике безопасности, мы не храним ваши ключи в открытом виде и показываем их только один раз при создании. Если вы не сохранили ключ, обратитесь в сообщество в Telegram.

Нужен ли мне VPN для работы с API? Что с ошибкой 401?

Нет. Наш эндпоинт api.vsellm.ru доступен напрямую с любых российских IP-адресов. Мы берём на себя всю маршрутизацию трафика до зарубежных дата-центров. Ошибка 401 обычно означает неверный ключ или неправильный Base URL. Убедитесь, что вы используете https://api.vsellm.ru/v1.

Совместим ли ваш API с библиотеками OpenAI?

Да, на 100%. Мы поддерживаем формат OpenAI. Вам не нужно переписывать код — достаточно изменить base_url и вставить наш API-ключ. Работают официальные SDK (Python/Node.js), LangChain и другие популярные инструменты.

Где смотреть баланс? Он раздельный для ключей?

Баланс единый для всего аккаунта. Вы можете создать 10 ключей для разных сотрудников, все они будут тратить средства с общего счёта. Детализацию расходов по каждому ключу можно посмотреть во вкладке «Активность» после авторизации.

Есть ли у вас триал?

Да. Активируйте промокод VSELLM во вкладке «Баланс» в личном кабинете для стартового баланса в 200 рублей. Скоро на сайте будет доступен функционал Playground для авторизованных пользователей, следите за обновлениями.

Вы читаете или сохраняете мои данные (промпты)?

Нет. Мы придерживаемся строгой политики Zero-Logging для содержимого запросов. Ваши промпты (inputs) и ответы нейросетей (outputs) проходят через наши серверы транзитом и нигде не сохраняются. Мы храним только мета-данные (количество токенов, модель, время запроса) для корректного биллинга и аналитики ваших расходов.

Что с задержкой (latency)? Не будет ли работать медленнее оригинала?

Задержка минимальна. Наши серверы оптимизированы для high-load-нагрузок. В большинстве случаев разница с прямым запросом к API провайдера составляет доли секунды, которые незаметны в продакшене.

Есть ли у вас кэширование (Prompt Caching)?

На стороне платформы VseLLM кэширования нет, и это наш осознанный выбор в пользу вашей безопасности. Чтобы кэшировать запросы, нам пришлось бы сохранять (логировать) тексты ваших промптов на своих серверах, что противоречит нашей политике Zero-Logging. При этом кэширование может срабатывать на стороне самих провайдеров (upstream), но мы не гарантируем это из-за работы системы балансировки. Для обеспечения стабильности мы можем отправлять ваши запросы через разные каналы, поэтому «поймать» кэш удаётся не всегда.

Можно ли установить лимиты расходов?

Да. При создании API-ключа в личном кабинете вы можете задать лимит по сумме. Когда лимит будет исчерпан, ключ перестанет работать, пока вы его не увеличите.

Как рассчитывается стоимость? У всех моделей по-разному?

Мы привели всё к единому стандарту для удобства: LLM и мультимодальные модели — за 1 млн токенов; картинки — за генерацию одного изображения; аудио — за минуту. Все списания отображаются в детализации в рублях. Актуальные цены на все модели можно найти здесь.

Как тарифицируется длинный контекст?

Для большинства моделей цена линейна. Однако, если провайдер (например, Google) использует повышенный тариф для контекста свыше 128k/200k токенов, стоимость может увеличиваться.

Влияет ли курс доллара на цены?

Внутренний баланс системы — в рублях. Цены на модели привязаны к курсу валют, но мы стараемся сглаживать колебания. Актуальные цены на все модели можно найти здесь.

Заказать демо