ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
360副总裁梁志辉:搜索和浏览器,是AI应用的明星场景|新质生产力·AI Partner大会
9077点击    2024-05-28 10:24

大模型加持下的搜索和浏览器,是360重构AI时代互联网入口的重要一步。


5月24日,36氪“新质生产力·AI Partner大会”于北京环球贸易中心正式拉开帷幕。大会聚焦AI场景与应用端,分为“AI能为我们做什么”和“我被AI赋能了”两大篇章。现场汇聚来自360、蚂蚁集团、联想、OPPO、百度、英特尔等企业的AI领域先锋者,以“赋能者”与“被赋能者”的不同视角,共同探讨AI技术如何“爆改”千行百业。


360集团的副总裁梁志辉,带来他的分享,内容经36氪编辑。



360 集团副总裁梁志辉


梁志辉:大家好,我是来自360的梁志辉,今天我分享一下360过去一年里在AI场景领域的探索。


关于AI大模型产品,过去有一段时间我们认为大模型就是聊天机器人,但实际上用户感受并不是太好,很多用户希望它是拟人化的数字人。后来我们发现大模型还是一个智能体,我们又尝试做了一些智能体应用。在整个探索大模型落地应用的过程中,我们发现用户需要的是真正的AI应用。


从几个角度来看,在一些榜单上,会有很多普通用户不一定理解的参数、学术角度写诗作画等能力,学术角度的评分不代表用户场景的真实需求。用户不会像AI工程师研究怎么写COT的提示词工程,用户关心的是如何让大模型写一个稿子、分析一个文档,最后帮我总结。


我们一直在找高频刚需有痛点的赛道,希望通过明星场景提高大模型的能力。结合360的优势,在安全、浏览器、搜索引擎我们有很多的经验和国民级应用,我们看到大模型各种听说读写的能力以后,我们认为大模型结合最好的产品,有可能是现在搜索和浏览器。


过去搜索一直是你提一个问题,让搜索引擎给你检索出十个网页,用户体验几乎到了天花板,但是有了大模型以后,让大模型帮你搜、读、写、问,更好地回答用户提交的问题,对所有的网页、视频进行深度阅读。


搜索引擎产品形态在过去20多年、将近30年里边没有太多变化,遇到很多实际的问题,比如复杂语义的理解,复杂问句在搜索引擎解决泛化性还是困难的。还有很多网页SEO、黑科技,出现错误或虚假信息误导用户,对用户的体验、伤害是很大的。


AI搜索让用户的使用行为发生很大的改变,在过去几年会看到很多用户打开搜索引擎找一些网页,现在搜索引擎只需要给一个确定性答案就可以了。360AI搜索是生成式答案引擎。很多问题没有答案,但是有很多参考答案,大模型可以给你在这里面总结生成答案,还可以针对一个问题进行追问,生成思维导图。


大模型不断提问挖掘问题本质,大模型生成的答案是多元思考,比如我问天空为什么是蓝的,这个场景下,我们用搜索结合大模型,可以从生理学角度、物理角度告诉你天为什么是蓝的。


为了实现AI搜索,我们用了五个大模型来实现更好的AI搜索体验,首先我们希望用大模型来帮助搜索引擎学会思考,用户提交含糊不清的问题,让大模型帮你进行更深入的改写和追问。同时我们认为在搜索过程中不应该只有一次搜索,比如提交一个问题“我明天要去迪士尼玩有哪些行程规划”,可以分三到五次搜索,多次搜索生成更好的答案。


大模型加持下,AI搜索不仅仅是大模型+搜索,过去我们做了很多垂直搜索,比如天气、股票、文档等各种垂直搜索,在今天都可以变成大模型的API、agent应用,比如明天去广州应该穿什么衣服,正常情况下,普通搜索回答这个问题很困难,有了大模型以后,可以推理出来如果明天去广州,我要先看广州的天气,这个时候就可以直接调出来。


我们发现大模型是博古通今的智慧能力,过去搜索引擎不可能实现的,但有了大模型以后,我们可以让大模型去阅读英文网页,比如有很多AI的新闻。国内都是自媒体改编过的,里面有很多信息损失,现在你可以通过AI搜索帮你阅读英文网页、学术论文,利用大模型通读一遍,以中文形式给你回答,结合语义给你准确的回答。对于学术研究、知识学习来说,用户体验大大提升。


浏览器是高频刚需的产品,但是浏览器过去只是右侧加了聊天机器人,这个跟你实际阅读行为、观看行为是没有关系的。数据显示,今天在PC端打开浏览器很多都是为了生产力,长网页超过一万字去读很费劲,很多英文论文一篇可能就2万字,我们也看到知识视频,几小时视频,传统方式实现快速阅读是不太可能的,用大模型帮你阅读,形成思维导图,这个体验是很好的。


一些发布会大概两个小时,通过大模型+浏览器,可以快速把发布会讲过的所有内容分析出来,按照时间线跳着去看发布会到底讲了什么东西。大模型可以根据语义对这个内容进行分割,让你浏览一个视频更方便。我们还可以把所有字幕分析出来,做思维导图总结,做要点提炼,在这个过程中可以快速生成海报、生成word文件,对媒体用户会很方便。


我们平时阅读的大量各种各样的学术论文、财报,比如让大模型快速把179页的内容进行分析,这里面大部分都是复杂的财务概念,用大模型进行思维导图分析,把整个财报的脉络分析出来。里面提到的关键信息抽取,只需要点击里面的问题或者自己输入一些问题,就可以进行快速文字提取和提炼。


有了模型可以理解视频和处理视频,有了这个场景,我们现在做视频,很多东西可以通过模型进行分析,把语气词一键删掉,大模型对视频文件阅读理解,可以把某一句话删掉,也可以把后面的话往前面提,在过去用标准剪辑软件剪辑视频,一个小时才能剪辑出来,现在有了大模型剪辑辅助工具,10分钟就可以完成。通过结合大模型能力的浏览器,把视频快速剪辑发布出去,从一个小时减少到十分钟,给大家的提效是非常明显的。


这些能力PC版都有,也发布了手机版,这些是免费的。在我们看来AI是很好的东西,希望通过我们的产品让更多人体验到。


文章来源于“李然然



关键词: AI , AI应用 , AI搜索 , AI产品 , AI落地
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
数字人

【开源免费】Fay开源数字人框架是一个AI数字人项目,该项目可以帮你实现“线上线下的数字人销售员”,

“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。

项目地址:https://github.com/xszyou/Fay

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/

4
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0

5
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales