Решил для одной рабочей задачки потестить подобные решения. Делюсь, что получилось.
Решение №1
https://github.com/dzhng/deep-research
Из плюсов: оч просто запускается и настраивается. 2 команды и вставить 2 ключа: OpenAI и Firecrawl. Но если у вас в API OpenAI не поддерживается o3-mini, то работать не будет. Поэтому я использовал API Nebius и модель R1 от deepseek. Настраивается тоже просто: прописываем url и так же добавляем ключ. Firecrawl даёт 500 запросов бесплатно - поэтому для теста хватит. Ключ получаете у них в админке.
Поставил простую задачку: собрать и проанализировать компании и сервисы, которые занимаются речевой аналитикой в России. На выходе полная дичь. И как такового исследования, как будто и не было. Например, во второй ссылке Гугла есть подборка на 30 сервисов аналитики откуда можно бы было взять информацию и расширить. Но этого сделано не было.
Попробовал упростить задачу и передал уже список конкурентов с ссылками на сайт и попросил сделать сравнительный анализ функционала и цен. Опять мимо. Цены не бьются от слова совсем. Где-то доллары, где-то рубли. По функционалу где-то попал, но нет ощущения, что это взято из сайта, а не из модели.
Решил дать финальный шанс: попросил подобрать сервис аналитики для маркетплейсов для Вб. В результатах ни одного актуального сервиса, лидером рынка назвал какого-то ноунейма, который даже в поиске не ищется.
❌ Вердикт: не рекомендасьон
Решение №2
DeepResearch от Hugginface
Не буду описывать подробно, но результат в целом не далеко ушел от первого варианта.
❌ Поэтому тоже не рекомендасьон.
Решение №3
https://github.com/mshumer/OpenDeepResearcher
Для работы нужно прописать 3 ключа:
⁃ OpenRouter
⁃ Jina
⁃ SerpAPI
Везде есть бесплатные лимиты.
Тоже запускается и работает в 2 клика. Здесь результат мне понравился больше.
Видно что он смотрит и какие ссылки посещает. Валидирует эти ссылки на предмет того, является ли она релевантной для запроса или нет.
Так же можно посмотреть ссылки, которые находит и поизучать их отдельно.
На генерации финального ответа информация была без галлюцинаций, но при этом достаточно сухая и поверхностная. Т.е мне с этим инструментом удобно посмотреть именно вширь того, что есть к изучению, но всё равно придется залезать и дополнять инфу руками.
⁉️Вердикт: 50/50
Решение №4
И напоследок затестил DeepResearch от Perplexity
Здесь был самый лучший результат.
Во-первых, визуально прикольно смотреть как он анализирует, делает выводы и описывает рассуждения.
Во-вторых, указывает все ссылки откуда брал инфу, подробно описал фунционал, особенности и фишки инструментов.
Из неприятного: потерял часть компаний для анализа т.к там не оказалось всей нужной информации. После дозапроса вернул и эту информацию.
✅ Вердикт: рекомендасьон
Вывод
Моё скромное ИМХО: это пока не vibe research когда ты отправляешь запросы и наблюдаешь за магией(как в cursor при разработке). Поисследовать пока все равно придется самостоятельно, но как инструменты для расширения собственного контекста вполне себе.
Сравнить с DeepResearch от OpenAI не могу т.к жаба душит отдавать для этого 200$