Использование голосового режима с Hermes

Голосовой режим позволяет вам общаться с Hermes Agent с помощью речи, делая взаимодействие более естественным и быстрым. В этом руководстве вы узнаете, как настроить и использовать эту функцию.

Обзор

Голосовой режим Hermes использует современные технологии преобразования речи в текст (STT) для понимания ваших команд и преобразования текста в речь (TTS) для озвучивания ответов. Это особенно полезно, когда ваши руки заняты или вам нужно быстро продиктовать длинный запрос.

Шаг 1: Настройте параметры аудио

Убедитесь, что ваш микрофон и динамики подключены и работают правильно. В файле конфигурации ~/.hermes/config.json вы можете настроить параметры аудио:

{
"voice": {
"stt_engine": "whisper",
"tts_engine": "elevenlabs"
}
}

Шаг 2: Включите голосовой режим

Запустите Hermes с флагом --voice:

hermes chat --voice

Шаг 3: Начните говорить

Когда Hermes готов к прослушиванию, на экране появится соответствующий индикатор. Просто произнесите ваш запрос. Hermes преобразует его в текст, обработает и озвучит ответ. Вы также можете переключаться между текстовым и голосовым вводом в любой момент.

Подробности о поддерживаемых движках и голосах вы найдете в разделе Функции: Голосовой режим.