AWS Bedrock

Hermes Agent поддерживает Amazon Bedrock как встроенный провайдер через Converse API — а не OpenAI-совместимый эндпоинт. Это даёт полный доступ к экосистеме Bedrock: IAM-аутентификация, Guardrails, кросс-региональные инференс-профили и все foundation-модели.

Предварительные требования

tip EC2 / ECS / Lambda На вычислительных ресурсах AWS прикрепите IAM-роль с AmazonBedrockFullAccess — и всё готово. Никаких API-ключей, никакой конфигурации .env — Hermes автоматически обнаруживает роль инстанса.

Быстрый старт

# Install with Bedrock support
pip install hermes-agent[bedrock]

# Select Bedrock as your provider
hermes model
# → Choose "More providers..." → "AWS Bedrock"
# → Select your region and model

# Start chatting
hermes chat

Конфигурация

После выполнения hermes model ваш ~/.hermes/config.yaml будет содержать:

model:
  default: us.anthropic.claude-sonnet-4-6
  provider: bedrock
  base_url: https://bedrock-runtime.us-east-2.amazonaws.com

bedrock:
  region: us-east-2

Регион

Установите регион AWS одним из следующих способов (наивысший приоритет — первый):

  1. bedrock.region в config.yaml

  2. Переменная окружения AWS_REGION

  3. Переменная окружения AWS_DEFAULT_REGION

  4. По умолчанию: us-east-1

Guardrails

Чтобы применить Amazon Bedrock Guardrails ко всем вызовам моделей:

bedrock:
  region: us-east-2
  guardrail:
    guardrail_identifier: "abc123def456"  # From the Bedrock console
    guardrail_version: "1"                # Version number or "DRAFT"
    stream_processing_mode: "async"       # "sync" or "async"
    trace: "disabled"                     # "enabled", "disabled", or "enabled_full"

Обнаружение моделей

Hermes автоматически обнаруживает доступные модели через управляющую плоскость Bedrock. Вы можете настроить обнаружение:

bedrock:
  discovery:
    enabled: true
    provider_filter: ["anthropic", "amazon"]  # Only show these providers
    refresh_interval: 3600                     # Cache for 1 hour

Доступные модели

Модели Bedrock используют ID инференс-профилей для вызова по запросу. Селектор hermes model показывает их автоматически, с рекомендуемыми моделями вверху:

Модель ID Примечания
Claude Sonnet 4.6 us.anthropic.claude-sonnet-4-6 Рекомендуется — лучший баланс скорости и возможностей
Claude Opus 4.6 us.anthropic.claude-opus-4-6-v1 Наиболее capable
Claude Haiku 4.5 us.anthropic.claude-haiku-4-5-20251001-v1:0 Самый быстрый Claude
Amazon Nova Pro us.amazon.nova-pro-v1:0 Флагман Amazon
Amazon Nova Micro us.amazon.nova-micro-v1:0 Самый быстрый, самый дешёвый
DeepSeek V3.2 deepseek.v3.2 Сильная открытая модель
Llama 4 Scout 17B us.meta.llama4-scout-17b-instruct-v1:0 Новейшая модель Meta

info Кросс-региональный инференс Модели с префиксом us. используют кросс-региональные инференс-профили, которые обеспечивают лучшую пропускную способность и автоматическое переключение между регионами AWS. Модели с префиксом global. маршрутизируются по всем доступным регионам по всему миру.

Переключение моделей во время сессии

Используйте команду /model во время разговора:

/model us.amazon.nova-pro-v1:0
/model deepseek.v3.2
/model us.anthropic.claude-opus-4-6-v1

Диагностика

hermes doctor

Диагностика проверяет:

Gateway (мессенджеры)

Bedrock работает со всеми gateway-платформами Hermes (Telegram, Discord, Slack, Feishu и др.). Настройте Bedrock как провайдера, затем запустите gateway обычным способом:

hermes gateway setup
hermes gateway start

Gateway читает config.yaml и использует ту же конфигурацию провайдера Bedrock.

Устранение неполадок

"No API key found" / "No AWS credentials"

Hermes проверяет учётные данные в следующем порядке:

  1. AWS_BEARER_TOKEN_BEDROCK

  2. AWS_ACCESS_KEY_ID + AWS_SECRET_ACCESS_KEY

  3. AWS_PROFILE

  4. Метаданные инстанса EC2 (IMDS)

  5. Учётные данные контейнера ECS

  6. Роль выполнения Lambda

Если ни один из источников не найден, выполните aws configure или прикрепите IAM-роль к вашему вычислительному инстансу.

"Invocation of model ID ... with on-demand throughput isn't supported"

Используйте ID инференс-профиля (с префиксом us. или global.) вместо обычного ID foundation-модели. Например:

"ThrottlingException"

Достигнут лимит скорости для модели в Bedrock. Hermes автоматически выполняет повторные попытки с экспоненциальной задержкой. Чтобы увеличить лимиты, запросите увеличение квоты в консоли AWS Service Quotas.

Развёртывание в AWS в один клик

Для полностью автоматизированного развёртывания на EC2 с CloudFormation:

sample-hermes-agent-on-aws-with-bedrock — создаёт VPC, IAM-роль, инстанс EC2 и автоматически настраивает Bedrock. Разверните в любом регионе одним кликом.