最强开源深度研究模型来了。
MiroMind ODR(Open Deep Research),来自代季峰加盟陈天桥的技术首秀。
首先,它做到了性能最强,GAIA测试结果更是达到了82.4分,超过了一众开源闭源模型,其中包括Manus、OpenAI的DeepResearch。
其次,它是真·全开源可复现,它的核心模型、数据、训练流程、AI Infra、DR Agent框架统统开源。
而据代季峰的朋友圈透露,他们将保持每月一次开源的更新速度。而这个项目是他们团队经过一个季度的努力而实现的。
从他们提供的演示来看,似乎都是在手机端上进行,因此不排除之后他们在手机端部署的可能性。
目前,他们还开放了Demo可以体验。
在Demo体验区有这样一句介绍,我们不提供AI(我们只是AI的搬运工),我们与您共同构建它。
好好好,说回到这个项目体验,目前它还属于比较早期,仅支持单轮次、且英文的对话输入。
随便选一个推荐问题上去,能够看到,它的思考过程和最终结果有很明显的分区。
思考过程左侧还有工作流的导览指引,你可以选择指定的节点进行查看。
过程中能够看到它支持联网搜索的。
最后的结果呈现得也比较清晰。
与现有的深度研究方法相比,MiroMind ODR项目开放了深度研究的各个阶段,包括四个子项目:
MiroFlow(Agent框架)、MiroThinker(模型)、MiroVerse(数据)和MiroTrain(训练基础设施)。
MiroFlow,支持多种主流工具调用,扩展大语言模型,支持工具辅助的深度研究推理。它的亮点在于可以稳定复现最强性能,也就是GAIA上82.4的成绩。
MiroThinker,原生支持工具辅助推理的大语言模型,可训练、可复现,在 GAIA 中表现最佳。
此外,它在GAIA-Text-103上取得了SOTA性能(60.2%),接近 OpenAI Deep Research。
MiroVerse,147K开源训练数据支持深度研究训练。此外团队还会关注社区反馈,每月持续提供高质量、深入的研究数据集。
MiroTrain,支持深度研究模型的稳定高效训练,覆盖整个Deep Research训练流程,支持长文本训练和RL训练工具。
不过除了这个项目之外,在GitHub上还看到了他们几周之前的成果MiroMind-M1。
MiroMind-M1是一系列基于Qwen-2.5 完全开源推理语言模型,专注于提升数学推理能力。
该模型通过监督式微调(SFT)在 719K 个精心筛选的问题集上进行训练,并采用可验证奖励的强化学习(RLVR)在 62K 个具有挑战性的示例上进行优化,使用了基于上下文的多阶段策略优化方法(CAMPO)。
在AIME24、AIME25和MATH500上,在基于7B Qwen-2.5的开源模型中取得了最佳性能。
这个项目中的核心人物,自然是代季峰这位大牛。
个人网站上依旧显示其清华大学电子工程系副教授岗位。
公开信息显示,代季峰在计算机视觉、深度学习领域发表国际期刊、会议文章80余篇,论文总引用6万余次。
他是R-FCN物体检测算法和Deformable ConvNets的作者。R-FCN被评价为“三大目标检测元模型之一”;而研发的Deformable ConvNets,性能超越微软、Meta、谷歌等机构的视觉大模型
他主导开发的InternVL多模态基础模型,是最具影响力的开源多模态基础模型之一,被广泛应用于工业界和学术界,Hugging Face下载量超过1千万次。
2009年和2014年于清华大学自动化系分别获得工学学士和博士学位。
随后微软亚洲研究院视觉组工作,担任首席研究员、研究经理。
2019年来到商汤的研究院工作,担任执行研究总监。直到2022年选择回归学界担任副教授。
这次选择再次出山,是为AGI而来。
据科创板日报消息,他加盟陈天桥旗下的盛大网络,正筹备一家新的AI创业公司,目标是打造第二个DeepSeek,将围绕AGI展开基础性研究。
这个公司有三个研发重点:AI商业决策智能化、突破算法茧房的内容分发,以及面向老龄化和青年发展的AI服务。
不过从MiroMind官网上也能看到出一些端倪,他们的使命是我们正在打造具备自我意识的数字生命体,与社区共同进化,以实现安全、有益的AGI惠及所有人。
所以,此次MiroMind ODR既是MiroMind的正式亮相,同样也是代季峰面向AGI的技术首秀。
Blog: https://miromind.ai/blog/miromind-open-deep-research
Demo: https://dr.miromind.ai/
GitHub: https://github.com/MiroMindAI
Hugging Face: https://huggingface.co/miromind-ai
文章来自于微信公众号“量子位”,作者是“白交”。
【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务,堪称「云端超级打工人」而且做到了开源界GAIA性能天花板,达到了57.7%,超越Huggingface 提出的Open Deep Research 55.15%的表现。
项目地址:GitHub:https://github.com/camel-ai/owl
【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!
项目地址:https://github.com/coze-dev/coze-studio
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner