Резервные провайдеры

Hermes Agent имеет три уровня отказоустойчивости, которые поддерживают работу ваших сессий при возникновении проблем у провайдеров:

Пул учётных данных — ротация нескольких API-ключей для одного и того же провайдера (проверяется в первую очередь)
Резервирование основной модели — автоматическое переключение на другой провайдер:модель при сбое основной модели
Резервирование вспомогательных задач — независимое разрешение провайдера для побочных задач, таких как vision, сжатие и извлечение веб-данных

Пулы учётных данных обрабатывают ротацию в рамках одного провайдера (например, несколько ключей OpenRouter). Эта страница описывает кросс-провайдерное резервирование. Обе опции необязательны и работают независимо.

Резервирование основной модели

Когда ваш основной LLM-провайдер сталкивается с ошибками — ограничениями частоты запросов, перегрузкой сервера, сбоями аутентификации, обрывами соединения — Hermes может автоматически переключиться на резервную пару провайдер:модель прямо в середине сессии, не теряя вашего разговора.

Настройка

Самый простой способ — интерактивный менеджер:

hermes fallback

hermes fallback использует тот же выбор провайдера, что и hermes model — тот же список провайдеров, те же запросы учётных данных, та же валидация. Используйте подкоманды add, list (алиас ls), remove (алиас rm) и clear для управления цепочкой. Изменения сохраняются в списке fallback_providers: верхнего уровня в config.yaml.

Если вы предпочитаете редактировать YAML напрямую, добавьте секцию fallback_model в ~/.hermes/config.yaml:

fallback_model:
  provider: openrouter
  model: anthropic/claude-sonnet-4

Оба поля — provider и model — обязательны. Если хотя бы одного из них нет, резервирование отключается.

Провайдер	Значение	Требования
AI Gateway	`ai-gateway`	`AI_GATEWAY_API_KEY`
OpenRouter	`openrouter`	`OPENROUTER_API_KEY`
Nous Portal	`nous`	`hermes auth` (OAuth)
OpenAI Codex	`openai-codex`	`hermes model` (ChatGPT OAuth)
GitHub Copilot	`copilot`	`COPILOT_GITHUB_TOKEN`, `GH_TOKEN` или `GITHUB_TOKEN`
GitHub Copilot ACP	`copilot-acp`	Внешний процесс (интеграция с редактором)
Anthropic	`anthropic`	`ANTHROPIC_API_KEY` или учётные данные Claude Code
z.ai / GLM	`zai`	`GLM_API_KEY`
Kimi / Moonshot	`kimi-coding`	`KIMI_API_KEY`
MiniMax	`minimax`	`MINIMAX_API_KEY`
MiniMax (Китай)	`minimax-cn`	`MINIMAX_CN_API_KEY`
DeepSeek	`deepseek`	`DEEPSEEK_API_KEY`
NVIDIA NIM	`nvidia`	`NVIDIA_API_KEY` (опционально: `NVIDIA_BASE_URL`)
GMI Cloud	`gmi`	`GMI_API_KEY` (опционально: `GMI_BASE_URL`)
StepFun	`stepfun`	`STEPFUN_API_KEY` (опционально: `STEPFUN_BASE_URL`)
Ollama Cloud	`ollama-cloud`	`OLLAMA_API_KEY`
Google Gemini (OAuth)	`google-gemini-cli`	`hermes model` (Google OAuth; опционально: `HERMES_GEMINI_PROJECT_ID`)
Google AI Studio	`gemini`	`GOOGLE_API_KEY` (алиас: `GEMINI_API_KEY`)
xAI (Grok)	`xai` (алиас `grok`)	`XAI_API_KEY` (опционально: `XAI_BASE_URL`)
AWS Bedrock	`bedrock`	Стандартная аутентификация boto3 (`AWS_REGION` + `AWS_PROFILE` или `AWS_ACCESS_KEY_ID`)
Qwen Portal (OAuth)	`qwen-oauth`	`hermes model` (Qwen Portal OAuth; опционально: `HERMES_QWEN_BASE_URL`)
MiniMax (OAuth)	`minimax-oauth`	`hermes model` (MiniMax portal OAuth)
OpenCode Zen	`opencode-zen`	`OPENCODE_ZEN_API_KEY`
OpenCode Go	`opencode-go`	`OPENCODE_GO_API_KEY`
Kilo Code	`kilocode`	`KILOCODE_API_KEY`
Xiaomi MiMo	`xiaomi`	`XIAOMI_API_KEY`
Arcee AI	`arcee`	`ARCEEAI_API_KEY`
GMI Cloud	`gmi`	`GMI_API_KEY`
Alibaba / DashScope	`alibaba`	`DASHSCOPE_API_KEY`
Alibaba Coding Plan	`alibaba-coding-plan`	`ALIBABA_CODING_PLAN_API_KEY` (запасной вариант: `DASHSCOPE_API_KEY`)
Kimi / Moonshot (Китай)	`kimi-coding-cn`	`KIMI_CN_API_KEY`
StepFun	`stepfun`	`STEPFUN_API_KEY`
Tencent TokenHub	`tencent-tokenhub`	`TOKENHUB_API_KEY`
Azure AI Foundry	`azure-foundry`	`AZURE_FOUNDRY_API_KEY` + `AZURE_FOUNDRY_BASE_URL`
LM Studio (локальный)	`lmstudio`	`LM_API_KEY` (или без ключа для локального) + `LM_BASE_URL`
Hugging Face	`huggingface`	`HF_TOKEN`
Собственный endpoint	`custom`	`base_url` + `key_env` (см. ниже)

Контекст	Резервирование поддерживается
CLI-сессии	✔
Мессенджеры (Telegram, Discord и др.)	✔
Делегирование сабэдженту	✘ (сабэдженты не наследуют конфигурацию резервирования)
Cron-задачи	✘ (выполняются с фиксированным провайдером)
Вспомогательные задачи (vision, сжатие)	✘ (используют свою цепочку провайдеров — см. ниже)

Задача	Что делает	Ключ конфигурации
Vision	Анализ изображений, скриншоты браузера	`auxiliary.vision`
Web Extract	Суммаризация веб-страниц	`auxiliary.web_extract`
Compression	Суммаризация для сжатия контекста	`auxiliary.compression`
Session Search	Суммаризация прошлых сессий	`auxiliary.session_search`
Skills Hub	Поиск и обнаружение навыков	`auxiliary.skills_hub`
MCP	Вспомогательные операции MCP	`auxiliary.mcp`
Approval	Умная классификация подтверждения команд	`auxiliary.approval`
Title Generation	Суммаризация названий сессий	`auxiliary.title_generation`
Triage Specifier	`hermes kanban specify` / кнопка ✨ на дашборде — превращает однострочную задачу триажа в полноценную спецификацию	`auxiliary.triage_specifier`

Провайдер	Описание	Требования
`"auto"`	Перебирать провайдеров по порядку, пока один не сработает (по умолчанию)	Хотя бы один настроенный провайдер
`"openrouter"`	Принудительно использовать OpenRouter	`OPENROUTER_API_KEY`
`"nous"`	Принудительно использовать Nous Portal	`hermes auth`
`"codex"`	Принудительно использовать Codex OAuth	`hermes model` → Codex
`"main"`	Использовать того же провайдера, что и основной агент (только для вспомогательных задач)	Активный основной провайдер
`"anthropic"`	Принудительно использовать Anthropic native	`ANTHROPIC_API_KEY` или учётные данные Claude Code

Функция	Механизм резервирования	Расположение в конфигурации
Основная модель агента	`fallback_model` в config.yaml — пошаговое переключение при ошибках (основная модель восстанавливается на каждом шаге)	`fallback_model:` (верхний уровень)
Vision	Цепочка автоопределения + внутренняя повторная попытка OpenRouter	`auxiliary.vision`
Извлечение веб-данных	Цепочка автоопределения + внутренняя повторная попытка OpenRouter	`auxiliary.web_extract`
Сжатие контекста	Цепочка автоопределения, понижение до отсутствия суммаризации, если недоступно	`auxiliary.compression`
Поиск по сессиям	Цепочка автоопределения	`auxiliary.session_search`
Skills hub	Цепочка автоопределения	`auxiliary.skills_hub`
MCP-помощники	Цепочка автоопределения	`auxiliary.mcp`
Классификация подтверждений	Цепочка автоопределения	`auxiliary.approval`
Генерация названий	Цепочка автоопределения	`auxiliary.title_generation`
Спецификатор триажа	Цепочка автоопределения	`auxiliary.triage_specifier`
Делегирование	Только переопределение провайдера (без автоматического резервирования)	`delegation.provider` / `delegation.model`
Cron-задачи	Только переопределение провайдера на задачу (без автоматического резервирования)	`provider` / `model` задачи

Резервные провайдеры

Резервирование основной модели

Настройка

Поддерживаемые провайдеры

Резервирование через собственный endpoint

Когда срабатывает резервирование

Примеры

Где работает резервирование

Резервирование вспомогательных задач

Задачи с независимым разрешением провайдера

Цепочка автоопределения

Настройка вспомогательных провайдеров

Параметры провайдера для вспомогательных задач

Прямое указание endpoint'а

Резервирование сжатия контекста

Переопределение провайдера для делегирования

Провайдеры для Cron-задач

Краткий обзор