人在中关村论坛现场。
刚刚看完了智谱的发布会。
说真的,即使玩过了这么多的DeepResearch产品,我也没想到,他们能扔出个这么个有趣的玩意。
让我觉得眼前一亮。
这个产品叫做,AutoGLM沉思版。
他们已经开放了内测,我在现场,一边听一边测一边写文章,看着屏幕里面的AutoGLM搜寻着各种各样的信息,再听着张鹏在台上讲述智谱在2025年的愿景,两种信息汇成河流,真的有一股别样的风景。
聊回到AutoGLM沉思版。
你可以简单地把他理解成,DeepResearch和AutoGLM的结合。
DeepResearch我已经安利过很多很多遍了,我觉得我还是有必要再在这里强调科普一下。
DeepResearch中文名即为深度研究,第一个做出这个产品的,是Google的Gemini。作用很简单,深度研究你提出的问题,然后花10到30分钟时间,搜索全网数据,然后给你一篇详细且非常有深度的展示报告。
但是Gemini做窜稀了,效果很烂。
真正把它发扬光大的,是OpenAI,用最牛逼的o3模型,微调了一个端到端的Agent模型,按照规划 - 执行 - 合成的路径去完成任务,还会在过过程中,动态调整任务。
至此,成为了我愿意每个月付200美刀都去用的功能,天天在群里吹。
不过国内说实话,一直都没有真正的DeepResearch。有很多类似的产品,但是我们一般称为DeepSearch。
注意看,一个是DeepResearch,一个是DeepSearch,后面的单词是有区别的。
Research代表的是深入研究、深度调查。
Search代表的更多的是更高级、更深层次的信息检索。
仅仅两个字母之差,但是在做法、目标上、结果、耗时上,其实是有巨大的区别的。
DeepSearch是比较新的AI搜索方式,其核心理念是在搜索、阅读和推理三个环节中不断循环,直到找到最优答案。
比如DeepSearch首先利用搜索引擎在互联网上广泛获取信息,然后对特定网页进行深入分析,最后通过推理评估当前状态,看看是否需要将原始问题拆解为更小的子问题,或者尝试其他搜索策略。可以通过多次搜索和推理的循环,最终得出更准确的答案。
DeepResearch则是在DeepSearch基础上的应用,主要是可以自动生成研究报告。
用户只需提供一个主题,DeepResearch会首先规划出报告的大致章节结构。然后,针对每个章节,利用DeepSearch进行信息搜索和推理,最后借助大模型进行整理和整合这些信息,生成完整的研究报告。
DeepResearch一般都是用一个通用基座模型专门微调的端到端模型,报告丰富详细,耗时最低几乎都是几分钟,平均十几分钟,我甚至还用OpenAI的DeepResearch跑过分析30分钟,输出4w6千字的任务。
国内目前做的最好的是秘塔的先想后搜,还有豆包的深度思考,这两个是DeepSearch的典范。
但是DeepResearch,目前确实还是一个空白。
而这次,智谱的AutoGLM沉思版,把这个空白补上了。甚至还用了更有趣的方式。就是把AutoGLM的部分能力,补足到了DeepResearch里。
最最最牛逼的是,完全免费,不限量,随便用。
AutoGLM我也写过两三次,从他们第一次发布开始我就一直在追踪了。
参见这一篇:智谱AI悄悄发布AutoGLM,这一次,贾维斯真的要成现实了。我就不过多赘述了。
至于DeepResearch+AutoGLM的融合,这个理解起来会有一点抽象,直接看case吧。
比如,最近两个月,我经常在玩《燕云十六声》,他们刚刚也上了河西篇。(PS:这不是燕云十六声的广告)
我真的非常非常喜欢《燕云十六声》的剧情,特别是其中开封城的一段28个NPC的支线,一叶知秋,我觉得是我将近20年的游戏生涯里,也是值得封神的一章。
所以我也对燕云十六州的那段历史故事,有了非凡的期盼。
所以,我就向AutoGLM沉思版提出一个问题:
我想了解《燕云十六声》中呈现的故事有哪些是真实历史背景的,请结合用户发掘出来的信息和真实史料进行详细解释,输出一篇1万字的报告,并给出引用。
这个问题,其实非常的不简单。不简单的原因在于,《燕云十六声》这款游戏,2024年12月27号才正式上线时间,几乎所有的正式资料,也都是在这之后的时间。
因为太新,可以说,没有任何一个模型,知晓《燕云十六声》的任何信息,他只能纯靠搜索和研究,一点一点的去理解,《燕云十六声》这款游戏是什么,里面的剧情是什么样,里面主要角色有哪些,再去跟真实的历史,一点一点的拼凑,一点一点的校对。
所以,让我来看看,AutoGLM沉思版是如何来解决这个问题的。
我先直接放一个我的一刀未剪完整版的12多分钟的录屏(很无聊,但是展示了全过程,有兴趣的可以看,没兴趣的可以看我下面的文字和动图介绍就行。)
在拿到任务后,AutoGLM沉思版第一步干的事情是,进行拆解问题和任务规划。
5步分的非常清晰。然后根据规划,开始正常搜索,比如第一波《燕云十六声》的基本信息,AutoGLM沉思版就抓了5个帖子来学习。
接下来,有趣的事情来了。
他希望,搜到关于游戏历史背景、剧情时间线的一些信息,他没有选择跟之前一样去搜索网页。
而是,通过AutoGLM,打开了我的浏览器,开始跟人一样,打开小红书,开始搜索这个关键词:
“燕云十六声,历史背景”
自己开始在小红书上,开始浏览帖子了。。。
直接连看3篇关于燕云十六声剧情的详情帖子。
这就是我说的,让我觉得AutoGLM沉思版最有趣的地方。
你知道的,在国内,有很多数据孤岛。
最优质的信息源,比如公众号、小红书、巨潮、知网等等,都只能在自己的搜索或者大模型产品中才能搜到。
元宝为啥搜索质量高,还不是因为公众号只有它能抓吗。
所以,不管你是DeepReasearch还是AI搜索,没有优质数据都是巧妇难为无米之炊。
但是AutoGLM沉思版,用一种非常猎奇同时又野蛮但有效的方式,解决了这个问题。
我既然抓取或者搜索不到,但是我自己有眼睛有手,我自己去看嘛还不行吗。我看看总不犯法吧。
于是,就有了上述一幕,打开了AutoGLM,开始自主浏览小红书,抓取信息。
这种事估计也就只有智谱能干的出来了,因为你想效果好,需要自己的DeepResearch和Agent模型,刚好,智谱都有,而且都是自己自研的。。。
而且,这个Agent模型,不是只能读取文字,图片也可以。
你会发现,这篇小红书的帖子里根本没啥字,字都在图里,但是AutoGLM沉思版,全都抓出来了,并且在思维链里,总结的很棒。
后续,就是不断的搜索,不断的思考,然后更改自己的目标。
它不仅会看小红书,还会打开知乎搜。
甚至,还知道要搜索微信公众号。
知道打开搜狗搜索,在上面搜“燕云十六声 历史背景 分析”,然后打开了一篇游戏萝卜的写的很棒的文章。
就这样噼里啪啦的,AutoGLM沉思版,打开了N个网页,甚至还一度打开了百度贴吧想去搜索,我连忙手动接管点了跳过。。。
再规划、推理、搜索了整整11分钟之后,一篇1w字的报告,终于放在了我的面前。
报告实在太长,我就不放全文了。从报告质量上来说,肯定是打不过OpenAI的DeepReasearch的,这玩意即使不看小红书公众号这些高质量答案,就靠公网上的那些信息,那个质量也是离谱她妈给离谱开门,真的离谱到家了。
智谱的这个AutoGLM沉思版,在我实测下来,报告质量,大概是能跟Gemini那个DeepResearch打个平手,甚至在一些我的实测问题上,更易读更深度一些。
从我曾经做过的象限图里,大概在这个位置。
优点有很多,包括模型能力是很强的,DeepResearch+AutoGLM的结合也是非常有趣。但是缺点,我也真的必须要吐槽一下。
就是智谱的C端产品体验,实在做的是太粗糙了。。。
比如这个AutoGLM沉思版,是需要电脑客户端运行的,这些我都理解。
但是,我在提出问题,你在运行问题的时候,你要不要学Claude或者Manus做个虚拟机?而不占用我自己的浏览器,虽然现在是可以最小化,但是也很蛋疼,我根本不敢动那个浏览器窗口。
还有,OpenAI和Gemini还有Grok都知道这个等待时间太长了,所以做了后台运行和进度条,你把窗口关了,或者你新起一个对话聊别的,都可以。
但是智谱这个AutoGLM沉思版,居然是唯一窗口,我想着我这个任务在这跑着,一会过个10分钟我回来收菜,先去跟你聊聊别的。当我试图新起一个窗口的时候,他居然给我弹Toast。告诉我当前对话正在进行中,居然不能干别的。。。。我。。。。。。
我不理解。
还有OpenAI的DeepResearch有个非常棒的交互,在我提出问题后,他会给我一个反问,帮我补全信息。
这个,智谱也没有。
从种种都可以看出,智谱是有模型底子的,他们的模型能力,坦率的讲,是真的很强。
比如这次终于发了他们新的推理模型GLM-Z1-Air,效果能打平DeepSeek R1,但是速度快8倍,价格是R1的1/30。沉思的底座模型也是基于GLM-Z1-Air微调来的GLM-Z1-Rumination,能搞非常长的使用工具+推理任务。
但是他们在产品的设计上,我也不知道是真的粗糙,还是太急了,就感觉,还不是很成熟,在体验上不得劲。。。
虽然产品设计上,有各种各样的问题,但是不可否认的是,AutoGLM沉思版,就是当今国内第一个真正的DeepResearch产品,而且还加入了AutoGLM的能力。
甚至,跟OpenAI那昂贵的价钱不一样,智谱他,不要钱,不限量,所有人免费用。
我已经能感受到,智谱的算力,会燃烧成什么样了。。。
回过头来,我们再说下,该怎么去用AutoGLM沉思版。
这次他们其实有两个产品。
一个是网页版的,你登录智谱清言https://chatglm.cn/。
看到输入框左下角的沉思按钮,激活就可以用。
但是因为网页版的问题,权限不够,所以只是沉思版,也就是个DeepResearch,没有AutoGLM的能力。
所以如果你想用有AutoGLM能力的AutoGLM沉思版,那你就得去他们官网:https://autoglm-research.zhipuai.cn/
下载桌面端产品,跟着教程配置一下权限,就OK了。
除了上面的《燕云十六声》的案例,我再给大家看两个AutoGLM沉思版写的报告。
比如我很喜欢星球大战,有一个问题是我一直想知道的,光剑的设计灵感。
就是《星球大战》里光剑的灵感据说来自东方武士文化,也有人说来自西方骑士剑,能否搜集官方采访或设计师访谈来对比考据?
而AutoGLM在深度研究之后,给我开了N多网页后,还拔高升华了一层。
后面还有光剑颜色的象征意义、光剑设计的演变、光剑在现代流行文化中的影响等等段落,我就不贴了。只贴个结论吧。
满分100分,我能打90分钟,真的。
还有一个就是,我昨天刚看到爱尔兰的初创公司Equal1发布全球首款硅基量子计算机Bell-1,我自己其实对量子计算非常好奇,我希望AutoGLM沉思版,帮我检索并总结2024年至今量子计算领域的重要研究突破。用时间线列出有哪些新的技术进展,这些进展意味着什么,以及可能带来的应用前景。
它在打开了一堆Google学术、arxiv论文、知乎之后。
给我来了一篇还不错的回答。
效果非常的好。
说实话,智谱的模型,是真的很强。但是在ToC的产品这一步,也许智谱走得还稍微有点踉踉跄跄,但这颗种子终究还是种下了。
今何在的《悟空传》中有一句我很喜欢的台词:
“花果山,什么时候才能重新长出花果来?不过,种子已经撒遍天下了。”
每一次进步都像一场晚风拂面的惊喜。
向前进吧。
智谱。
文章来自微信公众号 “ 数字生命卡兹克 ”,作者 数字生命卡兹克
【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务,堪称「云端超级打工人」而且做到了开源界GAIA性能天花板,达到了57.7%,超越Huggingface 提出的Open Deep Research 55.15%的表现。
项目地址:GitHub:https://github.com/camel-ai/owl
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI
【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址:https://github.com/InternLM/MindSearch
在线使用:https://mindsearch.openxlab.org.cn/
【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。
项目地址:https://github.com/miurla/morphic/tree/main
在线使用:https://www.morphic.sh/
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner