不到24小时,开源版Deep Research疯狂来袭!一月少花1400

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
不到24小时,开源版Deep Research疯狂来袭!一月少花1400
7628点击    2025-02-05 11:34

昨日,AI 社区最大的新闻当属 OpenAI 发布的全新智能体 Deep Research 了!


作为一个使用推理来综合大量在线信息并为用户完成多步骤研究任务的智能体,Deep Research 旨在帮助用户进行深入、复杂的信息查询与分析。


不到24小时,开源版Deep Research疯狂来袭!一月少花1400


显然,对于那些在金融、科学、政策和工程等领域从事密集知识工作并需要彻底、精确和可靠研究的用户而言,Deep Research 称得上研究神器了。


项目负责人之一 Zhiqing Sun(孙之清)本科毕业于北京大学计算机科学与技术系。2019 年起在 CMU 语言技术研究所攻读博士学位,现为 OpenAI 研究科学家。



不到24小时,开源版Deep Research疯狂来袭!一月少花1400


遗憾的是,Deep Research 目前仅供 Pro 订阅用户使用,每月 200 美元着实令很多人望而却步。



不到24小时,开源版Deep Research疯狂来袭!一月少花1400


所以,在 Deep Research 发布之后,各种开源复现版本纷至沓来。


从 OpenAI 发布的官方博客来看,Deep Research 用到了端到端的强化学习,并且在多个领域的复杂浏览和推理任务上进行了训练,因此才有了现在的性能。


其实,早在去年,来自字节跳动 ByteDance Research 的研究人员就提出了基于强化学习(Reinforcement Learning, RL)的 LLM Agent 框架 ——AGILE。该研究已被NeurIPS接收,这应该是学术界第一个用强化学习做Agent的端到端训练的工作。了解更多内容可以参考机器之心此前报道《端到端优化所有能力,字节跳动提出强化学习LLM Agent框架AGILE》。


接下来,我们看看在一天之内,都有哪些 Deep Research开源复现项目。


一、Open Deep Research


其中一个开源复现版本为「Open Deep Research」。


不到24小时,开源版Deep Research疯狂来袭!一月少花1400


项目地址:https://github.com/nickscamara/open-deep-research


具体而言,Open Deep Research 是一个 AI 智能体,可以对大量的 web 数据进行推理,该方法没有使用 o3 的微调版本,而是使用了爬虫工具 Firecrawl 的提取 + 搜索功能以及推理模型来深入研究网络。


项目主页还放出了 demo 展示,我们可以发现,在询问 Open Deep Research 关于「2025 年 B2B 领域最大的创业机会」时,Open Deep Research 给出了思考过程,答案也相当完美。


不到24小时,开源版Deep Research疯狂来袭!一月少花1400


根据项目介绍,我们可以得知 Open Deep Research 背后默认的模型为 gpt-4o,如果你想换个其他模型使用也是可以的,只需几行代码即可切换为 Anthropic、Cohere 等发布的模型。


二、OpenDeepResearcher


另外一个比较热门的复现项目为「OpenDeepResearcher」。


不到24小时,开源版Deep Research疯狂来袭!一月少花1400

项目地址:https://github.com/mshumer/OpenDeepResearcher


作为一个开源的 AI 智能体,OpenDeepResearcher 可以提供全面的研究。用户只需提供一个主题,该智能体就会展开研究,并返回一份综合报告。


其工作过程非常简单,对于给定的查询,OpenDeepResearcher 执行以下步骤:


  • 执行搜索,查看结果页面,并提取重要信息;
  • 如果它想深入了解,其可以重复此过程,并提出新的查询;
  • 完成后,它会使用上下文生成报告。


不到24小时,开源版Deep Research疯狂来袭!一月少花1400


三、node-DeepResearch


最后一个复现项目是「node-DeepResearch」,它是由 Jina AI CEO 肖涵(Han Xiao)创建。


他表示,OpenAI 的 Deep Research 只是在 while 循环中进行「搜索 + 读取 + 推理」。他在 nodejs 运行环境中,使用谷歌 gemini-flash 和 jina reader(Jina AI 推出的开源工具,将互联网上的 HTML 网页内容转换为适合 LLM 处理的纯文本格式)进行了复现。



不到24小时,开源版Deep Research疯狂来袭!一月少花1400

我们来看下运行效果。


下面是「jina ai 最新博客文章内容是什么」(what is the latest blog post from jina ai)的 2/3 步搜索示例:首先找到 jina ai 新闻网站、阅读其内容,然后确定最新帖子内容。


不到24小时,开源版Deep Research疯狂来袭!一月少花1400


下面视频是关于「who is the biggest, cohere, jina ai, voyage」的 13 步查询,经过搜索、反馈、循环之后,结果是正确的(cohere)。这里视频 2 倍加速。


不到24小时,开源版Deep Research疯狂来袭!一月少花1400


对于 node-DeepResearch,显然缺少了微调 o3 推理模型的支持。


不到24小时,开源版Deep Research疯狂来袭!一月少花1400


有人认为,这个项目实现了 OpenAI 准备了半年多的东西所做到的功能。还有人呼吁,赶紧把 UI 做得漂亮一点。


不到24小时,开源版Deep Research疯狂来袭!一月少花1400


目前,该项目已经收获了近 700 个 Stars。


不到24小时,开源版Deep Research疯狂来袭!一月少花1400



项目地址:https://github.com/jina-ai/node-DeepResearch


相信后续会有更多类似的开源智能体项目出来。



文章来自微信公众号 “ 机器之心 ”


不到24小时,开源版Deep Research疯狂来袭!一月少花1400

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

2
AI爬虫

【开源免费】ScrapeGraphAI是一个爬虫Python库,它利用大型语言模型和直接图逻辑来增强爬虫能力,让原来复杂繁琐的规则定义被AI取代,让爬虫可以更智能地理解和解析网页内容,减少了对复杂规则的依赖。

项目地址:https://github.com/ScrapeGraphAI/Scrapegraph-ai

3
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner