Веб-поиск и извлечение

Hermes Agent включает два веб-инструмента, вызываемых моделью, на базе нескольких провайдеров:

web_search — поиск в интернете с возвратом ранжированных результатов
web_extract — получение и извлечение читаемого контента с одного или нескольких URL (со встроенной поддержкой глубокого обхода, если бэкенд это предоставляет)

Оба инструмента настраиваются через единый выбор бэкенда. Провайдеры выбираются через hermes tools или задаются напрямую в config.yaml. Возможности рекурсивного обхода (Firecrawl/Tavily) доступны через web_extract, а не как отдельный инструмент web_crawl.

Бэкенды

Провайдер	Переменная окружения	Поиск	Извлечение	Обход	Бесплатный тариф
Firecrawl (по умолчанию)	`FIRECRAWL_API_KEY`	✔	✔	✔	500 кредитов/мес
SearXNG	`SEARXNG_URL`	✔	—	—	✔ Бесплатно (самостоятельное размещение)
Tavily	`TAVILY_API_KEY`	✔	✔	✔	1 000 поисков/мес
Exa	`EXA_API_KEY`	✔	✔	—	1 000 поисков/мес
Parallel	`PARALLEL_API_KEY`	✔	✔	—	Платный

Разделение по возможностям: вы можете использовать разных провайдеров для поиска и извлечения независимо — например, SearXNG (бесплатно) для поиска и Firecrawl для извлечения. См. Раздельную настройку ниже.

Размер страницы (символов)	Что происходит
Менее 5 000	Возвращается как есть — без вызова LLM, полная Markdown-разметка достигает агента
5 000 – 500 000	Однопроходное суммирование через вспомогательную модель `web_extract`, ограниченное ~5 000 символов вывода
500 000 – 2 000 000	Разбивка на части: разделяется на фрагменты по 100 тыс. символов, суммируется каждый параллельно, затем синтезируется итоговое резюме (~5 000 символов)
Более 2 000 000	Отклоняется с подсказкой использовать `web_crawl` с инструкциями по целевому извлечению или более конкретным источником

Наличие учётных данных	Автовыбранный бэкенд
`FIRECRAWL_API_KEY` или `FIRECRAWL_API_URL`	firecrawl
`PARALLEL_API_KEY`	parallel
`TAVILY_API_KEY`	tavily
`EXA_API_KEY`	exa
`SEARXNG_URL`	searxng

Веб-поиск и извлечение

Бэкенды

Как `web_extract` обрабатывает длинные страницы

Какая модель выполняет суммирование?

Когда суммирование мешает

Настройка

Быстрая настройка через `hermes tools`

Firecrawl (по умолчанию)

SearXNG (бесплатно, самостоятельное размещение)

Вариант A — Самостоятельное размещение с Docker (рекомендуется)

Вариант B — Использование публичного экземпляра

Объединение SearXNG с провайдером извлечения

Tavily

Exa

Parallel

Конфигурация

Единый бэкенд

Раздельная настройка по возможностям

Автоопределение

Проверка настройки

Устранение неполадок

`web_search` возвращает `{"success": false}`

`web_extract` сообщает "search-only backend"

SearXNG возвращает 0 результатов

Ограничение скорости на публичном экземпляре

`web_extract` возвращает усечённый контент с пометкой "summarization timed out"

Опциональный навык: `searxng-search`

Веб-поиск и извлечение

Бэкенды

Как web_extract обрабатывает длинные страницы

Какая модель выполняет суммирование?

Когда суммирование мешает

Настройка

Быстрая настройка через hermes tools

Firecrawl (по умолчанию)

SearXNG (бесплатно, самостоятельное размещение)

Вариант A — Самостоятельное размещение с Docker (рекомендуется)

Вариант B — Использование публичного экземпляра

Объединение SearXNG с провайдером извлечения

Tavily

Exa

Parallel

Конфигурация

Единый бэкенд

Раздельная настройка по возможностям

Автоопределение

Проверка настройки

Устранение неполадок

web_search возвращает {"success": false}

web_extract сообщает "search-only backend"

SearXNG возвращает 0 результатов

Ограничение скорости на публичном экземпляре

web_extract возвращает усечённый контент с пометкой "summarization timed out"

Опциональный навык: searxng-search

Как `web_extract` обрабатывает длинные страницы

Быстрая настройка через `hermes tools`

`web_search` возвращает `{"success": false}`

`web_extract` сообщает "search-only backend"

`web_extract` возвращает усечённый контент с пометкой "summarization timed out"

Опциональный навык: `searxng-search`