大模型加持下的搜索和浏览器,是360重构AI时代互联网入口的重要一步。
5月24日,36氪“新质生产力·AI Partner大会”于北京环球贸易中心正式拉开帷幕。大会聚焦AI场景与应用端,分为“AI能为我们做什么”和“我被AI赋能了”两大篇章。现场汇聚来自360、蚂蚁集团、联想、OPPO、百度、英特尔等企业的AI领域先锋者,以“赋能者”与“被赋能者”的不同视角,共同探讨AI技术如何“爆改”千行百业。
360集团的副总裁梁志辉,带来他的分享,内容经36氪编辑。
360 集团副总裁梁志辉
梁志辉:大家好,我是来自360的梁志辉,今天我分享一下360过去一年里在AI场景领域的探索。
关于AI大模型产品,过去有一段时间我们认为大模型就是聊天机器人,但实际上用户感受并不是太好,很多用户希望它是拟人化的数字人。后来我们发现大模型还是一个智能体,我们又尝试做了一些智能体应用。在整个探索大模型落地应用的过程中,我们发现用户需要的是真正的AI应用。
从几个角度来看,在一些榜单上,会有很多普通用户不一定理解的参数、学术角度写诗作画等能力,学术角度的评分不代表用户场景的真实需求。用户不会像AI工程师研究怎么写COT的提示词工程,用户关心的是如何让大模型写一个稿子、分析一个文档,最后帮我总结。
我们一直在找高频刚需有痛点的赛道,希望通过明星场景提高大模型的能力。结合360的优势,在安全、浏览器、搜索引擎我们有很多的经验和国民级应用,我们看到大模型各种听说读写的能力以后,我们认为大模型结合最好的产品,有可能是现在搜索和浏览器。
过去搜索一直是你提一个问题,让搜索引擎给你检索出十个网页,用户体验几乎到了天花板,但是有了大模型以后,让大模型帮你搜、读、写、问,更好地回答用户提交的问题,对所有的网页、视频进行深度阅读。
搜索引擎产品形态在过去20多年、将近30年里边没有太多变化,遇到很多实际的问题,比如复杂语义的理解,复杂问句在搜索引擎解决泛化性还是困难的。还有很多网页SEO、黑科技,出现错误或虚假信息误导用户,对用户的体验、伤害是很大的。
AI搜索让用户的使用行为发生很大的改变,在过去几年会看到很多用户打开搜索引擎找一些网页,现在搜索引擎只需要给一个确定性答案就可以了。360AI搜索是生成式答案引擎。很多问题没有答案,但是有很多参考答案,大模型可以给你在这里面总结生成答案,还可以针对一个问题进行追问,生成思维导图。
大模型不断提问挖掘问题本质,大模型生成的答案是多元思考,比如我问天空为什么是蓝的,这个场景下,我们用搜索结合大模型,可以从生理学角度、物理角度告诉你天为什么是蓝的。
为了实现AI搜索,我们用了五个大模型来实现更好的AI搜索体验,首先我们希望用大模型来帮助搜索引擎学会思考,用户提交含糊不清的问题,让大模型帮你进行更深入的改写和追问。同时我们认为在搜索过程中不应该只有一次搜索,比如提交一个问题“我明天要去迪士尼玩有哪些行程规划”,可以分三到五次搜索,多次搜索生成更好的答案。
大模型加持下,AI搜索不仅仅是大模型+搜索,过去我们做了很多垂直搜索,比如天气、股票、文档等各种垂直搜索,在今天都可以变成大模型的API、agent应用,比如明天去广州应该穿什么衣服,正常情况下,普通搜索回答这个问题很困难,有了大模型以后,可以推理出来如果明天去广州,我要先看广州的天气,这个时候就可以直接调出来。
我们发现大模型是博古通今的智慧能力,过去搜索引擎不可能实现的,但有了大模型以后,我们可以让大模型去阅读英文网页,比如有很多AI的新闻。国内都是自媒体改编过的,里面有很多信息损失,现在你可以通过AI搜索帮你阅读英文网页、学术论文,利用大模型通读一遍,以中文形式给你回答,结合语义给你准确的回答。对于学术研究、知识学习来说,用户体验大大提升。
浏览器是高频刚需的产品,但是浏览器过去只是右侧加了聊天机器人,这个跟你实际阅读行为、观看行为是没有关系的。数据显示,今天在PC端打开浏览器很多都是为了生产力,长网页超过一万字去读很费劲,很多英文论文一篇可能就2万字,我们也看到知识视频,几小时视频,传统方式实现快速阅读是不太可能的,用大模型帮你阅读,形成思维导图,这个体验是很好的。
一些发布会大概两个小时,通过大模型+浏览器,可以快速把发布会讲过的所有内容分析出来,按照时间线跳着去看发布会到底讲了什么东西。大模型可以根据语义对这个内容进行分割,让你浏览一个视频更方便。我们还可以把所有字幕分析出来,做思维导图总结,做要点提炼,在这个过程中可以快速生成海报、生成word文件,对媒体用户会很方便。
我们平时阅读的大量各种各样的学术论文、财报,比如让大模型快速把179页的内容进行分析,这里面大部分都是复杂的财务概念,用大模型进行思维导图分析,把整个财报的脉络分析出来。里面提到的关键信息抽取,只需要点击里面的问题或者自己输入一些问题,就可以进行快速文字提取和提炼。
有了模型可以理解视频和处理视频,有了这个场景,我们现在做视频,很多东西可以通过模型进行分析,把语气词一键删掉,大模型对视频文件阅读理解,可以把某一句话删掉,也可以把后面的话往前面提,在过去用标准剪辑软件剪辑视频,一个小时才能剪辑出来,现在有了大模型剪辑辅助工具,10分钟就可以完成。通过结合大模型能力的浏览器,把视频快速剪辑发布出去,从一个小时减少到十分钟,给大家的提效是非常明显的。
这些能力PC版都有,也发布了手机版,这些是免费的。在我们看来AI是很好的东西,希望通过我们的产品让更多人体验到。
文章来源于“李然然”
【开源免费】Fay开源数字人框架是一个AI数字人项目,该项目可以帮你实现“线上线下的数字人销售员”,
“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。
项目地址:https://github.com/xszyou/Fay
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址:https://github.com/InternLM/MindSearch
在线使用:https://mindsearch.openxlab.org.cn/
【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。
项目地址:https://github.com/miurla/morphic/tree/main
在线使用:https://www.morphic.sh/
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales