Справочник встроенных инструментов

На этой странице описаны встроенные инструменты Hermes, сгруппированные по наборам инструментов (toolsets). Доступность зависит от платформы, учётных данных и включённых наборов инструментов.

Краткая статистика (текущий реестр): ~70 инструментов — 10 инструментов браузера (ядро) + 2 инструмента браузера с CDP-доступом, 4 файловых инструмента, 10 RL-инструментов, 4 инструмента Home Assistant, 2 терминальных инструмента, 2 веб-инструмента, 5 инструментов Feishu, 7 инструментов Spotify (регистрируются встроенным плагином spotify), 5 инструментов Yuanbao, 7 инструментов Kanban (регистрируются, когда диспетчер Kanban порождает агента), 2 инструмента Discord и несколько отдельных инструментов (memory, clarify, delegate_task, execute_code, cronjob, session_search, skill_view/skill_manage/skills_list, text_to_speech, image_generate, vision_analyze, video_analyze, mixture_of_agents, send_message, todo, computer_use, process).

tip MCP Tools Помимо встроенных инструментов, Hermes может загружать инструменты динамически с MCP-серверов. MCP-инструменты отображаются с префиксом mcp_<сервер>_ (например, mcp_github_create_issue для MCP-сервера github). Настройки см. в разделе MCP Integration.

browser toolset

Инструмент Описание Требует окружение
browser_back Перейти на предыдущую страницу в истории браузера. Требует предварительного вызова browser_navigate.
browser_click Кликнуть на элемент, идентифицированный по его ref ID из снимка (например, '@e5'). Ref ID отображаются в квадратных скобках в выводе снимка. Требует предварительного вызова browser_navigate и browser_snapshot.
browser_console Получить вывод консоли браузера и ошибки JavaScript с текущей страницы. Возвращает сообщения console.log/warn/error/info и необработанные исключения JS. Используйте для обнаружения скрытых ошибок JavaScript, неудачных вызовов API и предупреждений приложения. Требует предварительного вызова browser_navigate.
browser_get_images Получить список всех изображений на текущей странице с их URL и альтернативным текстом. Полезно для поиска изображений для анализа с помощью инструмента vision. Требует предварительного вызова browser_navigate.
browser_navigate Перейти по URL в браузере. Инициализирует сессию и загружает страницу. Должен быть вызван перед другими инструментами браузера. Для простого получения информации предпочтительнее использовать web_search или web_extract (быстрее, дешевле). Используйте инструменты браузера, когда вам нужно взаимодействие с JavaScript, рендеринг или визуальный анализ.
browser_press Нажать клавишу на клавиатуре. Полезно для отправки форм (Enter), навигации (Tab) или сочетаний клавиш. Требует предварительного вызова browser_navigate.
browser_scroll Прокрутить страницу в определённом направлении. Используйте для отображения контента, находящегося ниже или выше текущего окна просмотра. Требует предварительного вызова browser_navigate.
browser_snapshot Получить текстовый снимок дерева доступности текущей страницы. Возвращает интерактивные элементы с ref ID (например, @e1, @e2) для browser_click и browser_type. full=false (по умолчанию): компактное представление с интерактивными элементами. full=true: полный снимок, включая неинтерактивный текст.
browser_type Ввести текст в поле ввода, идентифицированное по его ref ID. Очищает поле перед вводом нового текста. Требует предварительного вызова browser_navigate и browser_snapshot.
browser_vision Сделать скриншот текущей страницы и проанализировать его с помощью AI-зрения. Используйте, когда нужно визуально понять содержимое страницы — особенно полезно для CAPTCHA, задач визуальной верификации, сложных макетов или когда текстового снимка недостаточно.

browser toolset (CDP-доступные инструменты)

Эти два инструмента находятся в наборе browser, но регистрируются только при доступности конечной точки Chrome DevTools Protocol (CDP) при запуске сессии — через /browser connect, конфигурацию browser.cdp_url, сессию Browserbase или Camofox.

Инструмент Описание Требует окружение
browser_cdp Отправить сырую команду Chrome DevTools Protocol. Запасной вариант для операций браузера, не охваченных высокоуровневыми инструментами browser_*. См. https://chromedevtools.github.io/devtools-protocol/ CDP endpoint
browser_dialog Ответить на нативный диалог JavaScript (alert / confirm / prompt / beforeunload). Сначала вызовите browser_snapshot — ожидающие диалоги отображаются в поле pending_dialogs. Затем вызовите browser_dialog(action='accept'|'dismiss'). CDP endpoint

clarify toolset

Инструмент Описание Требует окружение
clarify Задать пользователю вопрос, когда вам нужно уточнение, обратная связь или решение перед продолжением. Поддерживает два режима: 1. Множественный выбор — предоставьте до 4 вариантов. Пользователь выбирает один или вводит свой ответ через опцию «Другое». 2. Открытый вопрос — пользователь вводит произвольный ответ.

code_execution toolset

Инструмент Описание Требует окружение
execute_code Запустить Python-скрипт, который может программно вызывать инструменты Hermes. Используйте, когда требуется 3+ вызова инструментов с логикой обработки между ними, нужно отфильтровать/сократить объёмные результаты инструментов перед их попаданием в контекст, требуется условное ветвление или сложная обработка данных.

cronjob toolset

Инструмент Описание Требует окружение
cronjob Единый менеджер запланированных задач. Используйте action="create", "list", "update", "pause", "resume", "run" или "remove" для управления задачами. Поддерживает задачи на основе навыков (skills) с одним или несколькими прикреплёнными навыками; skills=[] при обновлении очищает прикреплённые навыки. Запуски по Cron выполняются в свежих сессиях без контекста текущего чата.

delegation toolset

Инструмент Описание Требует окружение
delegate_task Запустить одного или нескольких субагентов для работы над задачами в изолированных контекстах. Каждый субагент получает свой собственный чат, терминальную сессию и набор инструментов. Возвращается только итоговое резюме — промежуточные результаты инструментов никогда не попадают в окно вашего контекста. ДВА РЕЖИМА: одиночная задача (строка) или пакетная (массив задач).

feishu_doc toolset

Ограничен обработчиком интеллектуальных ответов на комментарии в документах Feishu (gateway/platforms/feishu_comment.py). Недоступен в hermes-cli или обычном адаптере чата Feishu.

Инструмент Описание Требует окружение
feishu_doc_read Прочитать полное текстовое содержимое документа Feishu/Lark (Docx, Doc или Sheet) по его file_type и token. Учётные данные Feishu app

feishu_drive toolset

Ограничен обработчиком комментариев к документам Feishu. Обеспечивает чтение и запись комментариев в файлах на диске.

Инструмент Описание Требует окружение
feishu_drive_add_comment Добавить комментарий верхнего уровня к документу или файлу Feishu/Lark. Учётные данные Feishu app
feishu_drive_list_comments Показать все комментарии к документу Feishu/Lark, от самых новых. Учётные данные Feishu app
feishu_drive_list_comment_replies Показать ответы в конкретной ветке комментариев Feishu (по всему документу или по выделению). Учётные данные Feishu app
feishu_drive_reply_comment Опубликовать ответ в ветке комментариев Feishu, опционально с упоминанием @. Учётные данные Feishu app

file toolset

Инструмент Описание Требует окружение
patch Целевые замены и правки в файлах. Используйте вместо sed/awk в терминале. Использует нечёткое сопоставление (9 стратегий), поэтому небольшие различия в пробелах/отступах не помешают. Возвращает unified diff. Автоматически запускает проверки синтаксиса после редактирования.
read_file Чтение текстового файла с нумерацией строк и постраничным выводом. Используйте вместо cat/head/tail в терминале. Формат вывода: 'LINE_NUM|CONTENT'. Предлагает похожие имена файлов, если файл не найден. Используйте offset и limit для больших файлов. ПРИМЕЧАНИЕ: Не может читать изображения или бинарные файлы.
search_files Поиск содержимого файлов или поиск файлов по имени. Используйте вместо grep/rg/find/ls в терминале. Основан на Ripgrep, быстрее shell-аналогов. Поиск содержимого (target='content'): регулярные выражения внутри файлов. Режимы вывода: полные совпадения с номерами строк, только пути к файлам или количество совпадений.
write_file Записать содержимое в файл, полностью заменяя существующее содержимое. Используйте вместо echo/cat heredoc в терминале. Автоматически создаёт родительские директории. ПЕРЕЗАПИСЫВАЕТ весь файл — используйте 'patch' для целевых правок.

homeassistant toolset

Инструмент Описание Требует окружение
ha_call_service Вызвать сервис Home Assistant для управления устройством. Используйте ha_list_services для поиска доступных сервисов и их параметров для каждого домена.
ha_get_state Получить детальное состояние одной сущности Home Assistant, включая все атрибуты (яркость, цвет, заданная температура, показания датчиков и т.д.).
ha_list_entities Показать сущности Home Assistant. Опционально фильтровать по домену (light, switch, climate, sensor, binary_sensor, cover, fan и т.д.) или по названию помещения (living room, kitchen, bedroom и т.д.).
ha_list_services Показать доступные сервисы Home Assistant (действия) для управления устройствами. Показывает, какие действия можно выполнять над каждым типом устройств и какие параметры они принимают. Используйте, чтобы узнать, как управлять устройствами, найденными через ha_list_entities.

computer_use toolset

Инструмент Описание Требует окружение
computer_use Управление рабочим столом macOS в фоне через cua-driver — скриншоты (SOM / vision / AX), клик / перетаскивание / прокрутка / ввод текста / нажатие клавиш / ожидание, list_apps, focus_app. НЕ перехватывает курсор или фокус клавиатуры пользователя. Работает с любой моделью, поддерживающей инструменты. Только macOS. cua-driver в $PATH (установка через hermes tools).
**Инструменты Honcho** (`honcho_profile`, `honcho_search`, `honcho_context`, `honcho_reasoning`, `honcho_conclude`) больше не являются встроенными. Они доступны через плагин провайдера памяти Honcho по адресу `plugins/memory/honcho/`. См. [Memory Providers](../user-guide/features/memory-providers.md) для установки и использования.

image_gen toolset

Инструмент Описание Требует окружение
image_generate Генерация высококачественных изображений из текстовых запросов с помощью FAL.ai. Используемая модель настраивается пользователем (по умолчанию: FLUX 2 Klein 9B, генерация менее 1 секунды) и не выбирается агентом. Возвращает URL одного изображения. Отобразите его с помощью... (остальная часть описания продолжается). FAL_KEY

kanban toolset

Регистрируется только когда агент порождён диспетчером Kanban (установлена переменная HERMES_KANBAN_TASK). Позволяет работникам отмечать задачи как выполненные со структурированной передачей, блокировать запрос ввода от человека, отправлять сигналы пульса при длительных операциях, комментировать в тредах и (для оркестраторов) порождать подзадачи. Полный workflow см. в разделе Kanban Multi-Agent.

Инструмент Описание Требует окружение
kanban_show Показать активную задачу Kanban, назначенную этому работнику (название, описание, комментарии, зависимости). HERMES_KANBAN_TASK
kanban_complete Отметить текущую задачу как выполненную со структурированной передачей (результаты, артефакты, дальнейшие шаги). HERMES_KANBAN_TASK
kanban_block Заблокировать текущую задачу вопросом к пользователю — диспетчер приостанавливается, отображает вопрос и возобновляет работу после ответа человека. HERMES_KANBAN_TASK
kanban_heartbeat Отправить сигнал пульса во время длительной операции, чтобы диспетчер знал, что работник всё ещё активен. HERMES_KANBAN_TASK
kanban_comment Добавить комментарий в тред задачи без изменения её состояния — полезно для публикации промежуточных результатов. HERMES_KANBAN_TASK
kanban_create (Только для оркестратора) Породить подзадачи из текущей задачи. HERMES_KANBAN_TASK + роль оркестратора
kanban_link (Только для оркестратора) Связать задачи вместе (блокирует/заблокирована/связана). HERMES_KANBAN_TASK + роль оркестратора

memory toolset

Инструмент Описание Требует окружение
memory Сохранить важную информацию в постоянную память, которая сохраняется между сессиями. Ваша память отображается в системном промпте при запуске сессии — так вы помните информацию о пользователе и своём окружении между разговорами. КОГДА СОХРАНЯТЬ: когда пользователь делится личной информацией, предпочтениями, фактами о своей среде, долгосрочными целями или важными решениями.

messaging toolset

Инструмент Описание Требует окружение
send_message Отправить сообщение в подключённую платформу обмена сообщениями или показать доступные цели. ВАЖНО: Когда пользователь просит отправить в конкретный канал или человеку (а не просто название платформы), сначала вызовите send_message(action='list'), чтобы увидеть доступные цели.

moa toolset

Инструмент Описание Требует окружение
mixture_of_agents Направить сложную проблему через несколько передовых LLM совместно. Делает 5 API-вызовов (4 эталонные модели + 1 агрегатор) с максимальным усилием рассуждения — используйте экономно для действительно сложных задач. Лучше всего подходит для: сложной математики, продвинутых алгоритмов, задач, требующих множества точек зрения. OPENROUTER_API_KEY

rl toolset

Инструмент Описание Требует окружение
rl_check_status Получить статус и метрики тренировочного запуска. ОГРАНИЧЕНИЕ: минимум 30 минут между проверками одного запуска. Возвращает метрики WandB: step, state, reward_mean, loss, percent_correct. TINKER_API_KEY, WANDB_API_KEY
rl_edit_config Обновить поле конфигурации. Сначала используйте rl_get_current_config(), чтобы увидеть все доступные поля для выбранного окружения. Каждое окружение имеет разные настраиваемые параметры. Инфраструктурные настройки (tokenizer, URLs, lora_rank, learning_rate и т.д.) фиксированы. TINKER_API_KEY, WANDB_API_KEY
rl_get_current_config Получить текущую конфигурацию окружения. Возвращает только поля, которые можно изменить: group_size, max_token_length, total_steps, steps_per_eval, use_wandb, wandb_name, max_num_workers. TINKER_API_KEY, WANDB_API_KEY
rl_get_results Получить итоговые результаты и метрики завершённого тренировочного запуска. Возвращает финальные метрики и путь к обученным весам. TINKER_API_KEY, WANDB_API_KEY
rl_list_environments Показать все доступные RL-окружения. Возвращает названия, пути и описания окружений. СОВЕТ: Прочитайте содержимое file_path с помощью файловых инструментов, чтобы понять, как работает каждое окружение (верификаторы, загрузка данных, награды). TINKER_API_KEY, WANDB_API_KEY
rl_list_runs Показать все тренировочные запуски (активные и завершённые) с их статусом. TINKER_API_KEY, WANDB_API_KEY
rl_select_environment Выбрать RL-окружение для тренировки. Загружает конфигурацию по умолчанию для окружения. После выбора используйте rl_get_current_config() для просмотра настроек и rl_edit_config() для их изменения. TINKER_API_KEY, WANDB_API_KEY
rl_start_training Запустить новый тренировочный запуск RL с текущим окружением и конфигурацией. Большинство параметров тренировки (lora_rank, learning_rate и т.д.) фиксированы. Используйте rl_edit_config() для установки group_size, batch_size, wandb_project перед запуском. ПРЕДУПРЕЖДЕНИЕ: Тренировка может быть дорогой и длительной. TINKER_API_KEY, WANDB_API_KEY
rl_stop_training Остановить выполняющийся тренировочный запуск. Используйте, если метрики выглядят плохо, тренировка застопорилась или вы хотите попробовать другие настройки. TINKER_API_KEY, WANDB_API_KEY
rl_test_inference Быстрый тест инференса для любого окружения. Запускает несколько шагов инференса + оценки с использованием OpenRouter. По умолчанию: 3 шага x 16 завершений = 48 развёрток на модель, тестирование 3 моделей = 144 всего. Тестирует загрузку окружения, построение промпта, инференс и подсчёт очков. TINKER_API_KEY, WANDB_API_KEY

session_search toolset

Инструмент Описание Требует окружение
session_search Поиск в долговременной памяти прошлых разговоров. Это ваша способность вспоминать — каждая прошлая сессия доступна для поиска, и этот инструмент обобщает произошедшее. ИСПОЛЬЗУЙТЕ ПРОАКТИВНО когда: Пользователь говорит «мы это уже делали», «помнишь, когда», «в прошлый раз» — это явные признаки необходимости поиска.

skills toolset

Инструмент Описание Требует окружение
skill_manage Управление навыками (создание, обновление, удаление). Навыки — это ваша процедурная память: многократно используемые подходы для повторяющихся типов задач. Новые навыки сохраняются в ~/.hermes/skills/; существующие навыки можно изменять где бы они ни находились. Действия: create (полный SKILL.md со ссылками), update, delete.
skill_view Навыки позволяют загружать информацию о конкретных задачах и рабочих процессах, а также скрипты и шаблоны. Загружает полное содержимое навыка или доступ к его связанным файлам (ссылки, шаблоны, скрипты). Первый вызов возвращает содержимое SKILL.md плюс список связанных файлов.
skills_list Показать доступные навыки (название + описание). Используйте skill_view(name) для загрузки полного содержимого.

terminal toolset

Инструмент Описание Требует окружение
process Управление фоновыми процессами, запущенными с помощью terminal(background=true). Действия: 'list' (показать все), 'poll' (проверить статус + новый вывод), 'log' (полный вывод с постраничным просмотром), 'wait' (блокироваться до завершения или таймаута), 'kill' (завершить), 'write' (отправить сырые данные в stdin), 'submit' (отправить данные + Enter, для ответа на запросы), 'close' (закрыть stdin/отправить EOF).
terminal Выполнение shell-команд в Linux-окружении. Файловая система сохраняется между вызовами. Установите background=true для долго работающих серверов. Установите notify_on_complete=truebackground=true) для автоматического уведомления о завершении процесса — опрос не требуется. НЕ используйте cat/head/tail — используйте read_file. НЕ используйте grep/rg/find — используйте search_files.

todo toolset

Инструмент Описание Требует окружение
todo Управление списком задач для текущей сессии. Используйте для сложных задач с 3+ шагами или когда пользователь даёт несколько задач. Вызов без параметров читает текущий список. Запись: - Передайте массив 'todos' для создания/обновления элементов - merge=true (по умолчанию) обновляет существующие - merge=false заменяет весь список.

vision toolset

Инструмент Описание Требует окружение
vision_analyze Анализ изображений с помощью AI-зрения. Предоставляет подробное описание и отвечает на конкретный вопрос о содержимом изображения.

video toolset

Опциональный набор (не загружается в стандартном наборе hermes-cli). Добавьте через --toolsets video или включите video в вашу конфигурацию toolsets:.

Инструмент Описание Требует окружение
video_analyze Анализ видео из URL или файла — субтитры, разбивка по сценам, ключевые временные метки и визуальные описания.

web toolset

Инструмент Описание Требует окружение
web_search Поиск информации в интернете. Возвращает до 5 результатов по умолчанию с заголовками, URL и описаниями. Принимает опциональный параметр limit (1-100, по умолчанию 5). Запрос передаётся настроенному бэкенду, поэтому такие операторы, как site:domain, filetype:pdf, intitle:word, -term и "точная фраза", могут работать, если бэкенд их поддерживает. EXA_API_KEY или PARALLEL_API_KEY или FIRECRAWL_API_KEY или TAVILY_API_KEY
web_extract Извлечение содержимого из URL веб-страниц. Возвращает содержимое страницы в формате markdown. Также работает с PDF-ссылками — передайте URL PDF напрямую, и он будет преобразован в markdown. Страницы менее 5000 символов возвращают полный markdown; более крупные страницы обобщаются LLM. EXA_API_KEY или PARALLEL_API_KEY или FIRECRAWL_API_KEY или TAVILY_API_KEY

tts toolset

Инструмент Описание Требует окружение
text_to_speech Преобразование текста в аудиоречь. Возвращает путь MEDIA:, который платформа доставляет как голосовое сообщение. В Telegram воспроизводится как голосовой пузырёк, в Discord/WhatsApp — как аудиовложение. В режиме CLI сохраняется в ~/voice-memos/. Голос и провайдер настраиваются.

discord toolset

Регистрируется в наборе инструментов платформы hermes-discord (только gateway). Использует тот же токен бота, что и адаптер обмена сообщениями.

Инструмент Описание Требует окружение
discord Чтение и участие в Discord-сервере. Действия включают search_members, fetch_messages, send_message, react, fetch_channel, list_channels и другие. DISCORD_BOT_TOKEN

discord_admin toolset

Регистрируется в наборе инструментов платформы hermes-discord. Действия модерации требуют соответствующих разрешений Discord у бота.

Инструмент Описание Требует окружение
discord_admin Управление Discord-сервером через REST API: список гильдий/каналов/ролей, создание/редактирование/удаление каналов, управление ролями, тайм-ауты, кики и баны. DISCORD_BOT_TOKEN + разрешения бота

spotify toolset

Регистрируется встроенным плагином spotify. Требует OAuth-токен — выполните hermes spotify setup один раз для авторизации.

Инструмент Описание Требует окружение
spotify_playback Управление воспроизведением Spotify, просмотр активного состояния воспроизведения или получение недавно проигранных треков. Spotify OAuth
spotify_devices Список устройств Spotify Connect или перенос воспроизведения на другое устройство. Spotify OAuth
spotify_queue Просмотр очереди Spotify пользователя или добавление элемента в неё. Spotify OAuth
spotify_search Поиск в каталоге Spotify по трекам, альбомам, исполнителям, плейлистам, шоу или эпизодам. Spotify OAuth
spotify_playlists Просмотр, просмотр, создание, обновление и изменение плейлистов Spotify. Spotify OAuth
spotify_albums Получение метаданных альбома Spotify или треков альбома. Spotify OAuth
spotify_library Просмотр, сохранение или удаление сохранённых треков или альбомов Spotify пользователя. Spotify OAuth

hermes-yuanbao toolset

Регистрируется только в наборе инструментов платформы hermes-yuanbao. Yuanbao — это чат-приложение Tencent; эти инструменты управляют его API для личных сообщений, групп и стикеров.

Инструмент Описание Требует окружение
yb_query_group_info Запрос базовой информации о группе (называется «派/Pai» в приложении): название, владелец, количество участников. Учётные данные Yuanbao
yb_query_group_members Запрос участников группы (для упоминаний @, поиска пользователя по имени, списка ботов). Учётные данные Yuanbao
yb_send_dm Отправка личного/прямого сообщения пользователю в группе, опционально с медиафайлами. Учётные данные Yuanbao
yb_search_sticker Поиск в каталоге встроенных стикеров Yuanbao (TIM face) по ключевому слову. Учётные данные Yuanbao
yb_send_sticker Отправка встроенного стикера в текущий чат Yuanbao. Учётные данные Yuanbao