号称“近10年最大改版”,百度搜索这是要自己革自己的命?
刚刚,百度搜索突然大变样,全链路升级。
就连沿用多年的搜索框都焕然一新,取而代之的是一个“放大版”的AI智能框,不仅支持一次千字以上超长文本搜索,搜索形式更是花样百出。
全新百看功能同步上线,在输出端能自动分析并匹配用户需求,把最有用、最适配的多模态富媒体内容优先呈现给用户。
比如搜一个复杂问题“如何辨别水晶真假”,它会把含具体方法的最新视频、图片、文字消息打包在一个综合答案里,让你一目了然:
原来的AI识图相机竟也变了,进化成了AI生成式相机,拍一张洗衣机故障照片,无需多言,它直接精准拿捏你的需求,告诉你哪里坏了、怎么修:
除此之外,还有一系列新产品和功能齐刷刷上线,有能写代码、做深度研究的升级版AI助手,还有一句话生成3分钟爆款视频的视频智能创作能力,有已经接入了1.8万+优质MCP的百度搜索开放生态,还有全新百度自研图生视频大模型“绘想”……
看完之后咱只想说:百度搜索,这次真的是下定决心要变革了。
实际上,正在迅速作出改变的不止百度一家,谷歌等巨头亦在重塑搜索形态,苹果前几天还传出要收购明星创业公司Perplexity AI,为自家未来AI搜索引擎加码,可见竞争之激烈。
而百度搜索的改版,可以说是全球搜索引擎自我求变的一个缩影。
那么问题来了——
这次改版,表面上看是功能升级,但仔细体验下来,会发现这其实是一场从底层到用户体验的全链路重做。
最直观的变化,莫过于AI智能框的诞生。
它不仅扩展了传统搜索框的搜索长度,告别以往关键词搜索限制,可进行超长文本搜索,而且现在还支持用户上传文件搜索了:
文件搜索,支持超10种常见文件格式:
语音搜索,说完即搜极速响应:
智能框下方还有一系列工具可调用,包括AI写作、AI画图、AI出游、AI解题。
特别值得一提的是,传统搜索框并未直接下线,大家可以自由选择“智能模式”切换至AI智能框,不用担心无法快速适应新搜索模式的问题。
当然也能图片搜索,而且这块改变更大。
AI识图相机进化成了AI生成式相机,依托于多模态AI大模型的能力,无需用户文本输入,即可自动解析用户需求。
拍照后接着问其它问题也可以,比如帮一只猫猫起个名字:
AI生成式相机还配有so~many~修图、出片神器,这里就不一一展示了:
此外,多模态搜索怎么能落下视频,百度的AI助手推出视频通话玩法,能像和真人通话一样,开着摄像头让AI帮你答疑解惑,用来当个陪伴聊天的搭子也不错。
接下来再看看输出端,全新百看功能来了。
搜索结果界面不再是一串串链接,用户不用再点开N个网页自己找答案。百看会把最有用、最匹配的富媒体内容优先呈现给用户。
问同一个问题,改版前VS改版后差别明显:
百看加持,搜“最近有啥好看的电视剧”,首先跳出来的就是最清晰的带豆瓣评分的电视剧推荐板块,最新、好评、最热、爱情、古装分门别类列好,一目了然。
往下拉,还有AI总结整理全网信息得出的推荐清单,网友分享的相关短视频也应有尽有。
这只是其中一种输出结构,还有配有智能体或是真人视频讲解+文字总结式的回答:
甚至搜索咖啡店,它会条理清晰地安利几家,评分、地点、特色、出行方案都标注好,选择其中一个店打开跳转后,可直接打车到店或者线上购买到店套餐。
可以说,输入端和输出端的改版,让百度搜索同时拥有了AI超级入口和AI超级出口,搜索不再是一个简单的工具,而是能够输出更丰富的内容直接完成任务交付。
而这还只是上层应用的最新表现。
百度又放出了另一个大招,AI智能助手全面升级,而且将接入超1.8w+ MCP。
当前百度搜索开放平台已成为国内收录MCP最多、最全的平台,接入平台的MCP和AI应用可通过搜索免费获得最精准的流量,直达用户需求,提升曝光的同时还能带来实打实的业务收益。
用户可通过AI智能助手直接调用涵盖天气、网盘、二次元等MCP server,一句话让其执行任务,实现搜索即服务。
AI智能助手还新增了富媒体区,具备图文、视频、图表多模态混排能力,能够主动规划、分解任务、调用资源。
可以直接把它当成一个工作台,一边让它写一份年度工作总结与未来规划报告,一边生成后还可以直接进行编辑调整,局部段落还能让AI重新生成润色。
图片生成也支持如此操作:
生成好后,点击某张图可在右侧调出工作台进行一系列编辑,比如提取线稿:
编写代码也行:
生成的小游戏可以直接在右侧工作台玩:
得益于深度思考模型文心X1以及DeepSeek模型的接入,AI智能助手能自由调度进行深度搜索:
视频生成这一块,百度搜索还全新推出了AI智能创作中心,自动调用各种模型能力,只需一句话就能生成时长长达3分钟的爆款视频。
百度AI智能创作中心中提供开箱即用的创作工具,涵盖选题、剧本、分镜、发布,实现快速创作。
用户还可根据热门模版生成视频,无需复杂的编排、剪辑操作,一句话一个爆款。
各种风格的视频都能驾驭,生成龟兔赛跑的动画也能行:
百度搜索还打通了全网主流视频消费平台,用户可以一键多渠道发布。
不仅如此,智能创作中心同时支持图文生成,可以秒秒钟生成小红书风格的精美笔记。
最底层,支撑这一系列最新能力的,是百度文心4.5系列大语言模型、视频生成模型。
两天前,百度刚官宣文心大模型4.5系列正式开源,一次性推出10款模型,涵盖从47B参数的混合专家模型到轻量级0.3B稠密型模型,覆盖多种任务需求。
如今,百度商业研发团队又拿出了新产品——自研图生视频大模型绘想(MuseSteamer),共有四个版本:
Lite版本,生成速度快,具有成本优势,特别是生成720p视频成本低于行业。
Turbo版本,具备图生720p视频的能力,人物生成特别是真人生成的一致性强,表情表现力上有显著优势。
Pro版本,支持生成1080p视频,具有电影级画质及运镜,视频表现力极大提升。
来看下面这个效果,真的让人后背发凉,很难看出AI痕迹:
最后特别要指出的是有声版,各清晰度均支持,可以生成音效、台词一体化的视频,画面质感大片级,效果be like:
连弹钢琴的旋律都能和画面完美对齐:
模型能力变强底座变强,中间层的AI工具和服务调度能力也水涨船高。
目前,Turbo版已上线绘想平台开启限时免费公测,其余版本将于8月陆续开放。
总结来看百度搜索这次的改版,不难看出,其实是百度搜索在底层模型能力、中间层工具能力、上层应用能力的“三层协同”。
底层,以文心4.5大语言模型和视频生成模型为引擎;中间层,是百度搜索开放平台和文心智能体平台等提供的MCP+Agent工具全面接入;上层,则通过超级框、百看、AI助手等C端产品不断进化体验,最终实现了从通用化到个性化、从工具化到内容化、从信息检索到任务交付的转型。
与此同时,百度在技术和战略上的一系列考量呈现出了开放与自研并举的特点。
一方面,百度积极接入DeepSeek等行业领先大模型能力,还打造了国内最大AI生态MCP服务。
另一方面,百度也在加速推进自研技术的落地,无论是刚刚开源的文心大模型4.5系列,还是上面提到的自研图生视频大模型,都是百度十多年AI技术积累的产物。
这种既当“集成商”又当“研发者”的姿态,使其有别于一些同行的单一路线。
另外,相较于谷歌在I/O大会上聚焦内部技术整合的保守迭代路线,百度明显选择了更具挑战性的全链路重构:
从产品形态到商业模式,从用户体验到开发者生态,全都重做一遍。
为什么选择在这个时间点进行如此激进的改革?
外部看,AI大模型快速发展正在重塑用户搜索习惯。用户不再满足于简单的信息检索,而是期望更智能、更个性化、更具操作性的结果。
内部看,这是百度从工具化向内容化、从信息化向服务化转型的战略必然。搜索作为百度立身之本,必须在AI时代找到新的价值定位和增长引擎。
更深层来看,这种激进改变策略的背后,是百度对AI时代搜索引擎本质变化的深度洞察。
它预示着搜索引擎正在从工具属性向平台属性演进。未来的搜索引擎不仅要有强大的信息检索能力,更要具备任务执行、内容创作、服务调度等综合能力。
在这个维度之上,百度搜索的这次改版更像是在为下一代的搜索引擎形态探路。
当然,如此大的产品改版也面临着用户适应、生态建设、商业模式验证等多重挑战。但从目前展现的产品形态和技术能力来看,百度搜索确实在尝试一次真正意义上的自我革命。
这场革命的成败,不仅关乎百度自身的未来,也将深刻影响整个搜索行业的发展方向。
文章来自于“量子位”,作者“西风”。
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI
【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址:https://github.com/InternLM/MindSearch
在线使用:https://mindsearch.openxlab.org.cn/
【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。
项目地址:https://github.com/miurla/morphic/tree/main
在线使用:https://www.morphic.sh/