Голосовой режим

Голосовой режим позволяет взаимодействовать с Hermes с помощью голоса. Вы можете говорить с агентом, и он будет отвечать синтезированным голосом, имитирующим человеческую речь.

Обзор

Голосовой режим идеально подходит для ситуаций, когда ваши руки заняты или когда вы предпочитаете более естественный, разговорный способ общения с ИИ. Он включает в себя систему распознавания речи (Speech-to-Text) и систему синтеза речи (Text-to-Speech).

Включение голосового режима

Чтобы включить голосовой режим, используйте флаг --voice при запуске интерактивного чата в терминале:

hermes chat --voice

При первом запуске Hermes может попросить разрешение на доступ к вашему микрофону и динамикам.

Использование голосового режима

Когда голосовой режим активирован, рабочий процесс выглядит следующим образом:

  1. Hermes слушает: После своего ответа или при запуске чата агент переходит в режим ожидания голоса.
  2. Вы говорите: Просто произнесите свой запрос или команду. Hermes автоматически определит конец вашей фразы.
  3. Hermes отвечает: Агент обработает запрос и выведет текстовый ответ, одновременно озвучивая его.

Вы можете прервать ответ агента, просто начав говорить (в режиме дуплексной связи, если это поддерживается вашей аудиосистемой).

Настройка

Вы можете выбрать различные голоса и настроить чувствительность микрофона в файле конфигурации. Подробности см. в разделе Конфигурация.