Голосовой режим
Голосовой режим позволяет взаимодействовать с Hermes с помощью голоса. Вы можете говорить с агентом, и он будет отвечать синтезированным голосом, имитирующим человеческую речь.
Обзор
Голосовой режим идеально подходит для ситуаций, когда ваши руки заняты или когда вы предпочитаете более естественный, разговорный способ общения с ИИ. Он включает в себя систему распознавания речи (Speech-to-Text) и систему синтеза речи (Text-to-Speech).
Включение голосового режима
Чтобы включить голосовой режим, используйте флаг --voice при запуске интерактивного чата в терминале:
hermes chat --voice
При первом запуске Hermes может попросить разрешение на доступ к вашему микрофону и динамикам.
Использование голосового режима
Когда голосовой режим активирован, рабочий процесс выглядит следующим образом:
- Hermes слушает: После своего ответа или при запуске чата агент переходит в режим ожидания голоса.
- Вы говорите: Просто произнесите свой запрос или команду. Hermes автоматически определит конец вашей фразы.
- Hermes отвечает: Агент обработает запрос и выведет текстовый ответ, одновременно озвучивая его.
Вы можете прервать ответ агента, просто начав говорить (в режиме дуплексной связи, если это поддерживается вашей аудиосистемой).
Настройка
Вы можете выбрать различные голоса и настроить чувствительность микрофона в файле конфигурации. Подробности см. в разделе Конфигурация.