AI已经成为云服务商的标配,但是怎么做才能满足用户的需求,百度有自己的理解。
当下的人类正站在AI时代的开端,社会中的每一个人都在被强大的AI技术赋能。聚焦AI领域的“赋能者”与“被赋能者”,36氪“新质生产力·AI Partner大会”以“我被AI赋能了”为主题,汇聚国内AI领域重量级嘉宾,一起共探AI行业新图景。
5月24日,36氪“新质生产力·AI Partner大会”于北京环球贸易中心正式拉开帷幕。大会聚焦AI场景与应用端,分为“AI能为我们做什么”和“我被AI赋能了”两大篇章。现场汇聚来自百度,蚂蚁集团、联想、OPPO、英特尔等企业的AI领域先锋者,以“赋能者”与“被赋能者”的不同视角,共同探讨AI技术如何“爆改”千行百业。
以下为百度智能云副总裁喻友平演讲原文:
百度智能云副总裁喻友平
大家好,我是百度智能云的喻友平。今天会议讲的是关于大模型、AI应用,跟我做的工作非常契合,非常高兴跟大家做分享。
从去年到今年,大模型可以帮助2B领域做点什么,一直备受关注。从百度智能云千帆大模型平台的调用情况来看,可以看到大模型在企业方方面面都已经落地了,无论是市场营销,还是生产、制造甚至供应链各个环节都有大量的应用。在千帆大模型平台,我们有数十万个应用,十几万位开发者进行开发。
在一些被通用的应用覆盖的场景,百度智能云也有做一些工作。我们基于千帆大模型平台,在面向企业的对外营销和内部办公这两个大的场景里面,提供了七个产品,覆盖企业的市场营销图片和视频制作、数字人(数字人在企业营销和销售领域有非常多应用的潜力)、智能客服,还有知识管理(这是面向企业内部的,知识管理和智能客服是大模型在企业2B端应用最先落地的重要场景),还包括办公企业一站式入口,以及生成式BI、辅助编程领域。在大模型2B领域热门的应用方向,我们简单说一下做这些产品的心得和体会。
在百度智能云,我们有一个产品叫一念,是大模型营销内容创作的平台。有了大模型以后,各种内容创作从文字到图片、视频,现在都在逐步成熟。图片领域相对来说已经被产品化了;在视频领域,虽然国外有很多创新方向,但企业在实际应用中还是需要结合现实性的内容跟一些虚拟内容做结合,包括主题生成、整体智能编排等。在这些工作上,百度智能云一念做的也不错。
我们跟迪思传媒合作,利用一念的能力来提速汽车行业营销物料制作,比如给马自达新车做的宣发视频,如果人工去做,需要一到两天的时间;用一念去做,只要把相关素材上传后,大模型可以帮你自动写脚本,自动从素材库把相关的素材找出来,合成基本可以用的视频,大概5分钟就可以生成质量能够达到可用水平的视频。
除了大模型剧本写作能力,所有台词基本上也都是AI直接帮你生成的,在这里,更多借助的不一定是大模型,可能是小模型对内容素材理解的能力,每一句话都可以找到跟这句话相关的素材,看起来画面和语音还是非常流畅的。
百度智能云曦灵是全栈数字人平台。数字人有多种形态,有2D、3D。数字人技术中主要是语音技术、视觉技术以及大模型技术,这三个方面技术的应用。在应用场景方面,直播、视频制作、对话以及品牌代言人,这几个方向上百度智能云曦灵的能力是比较突出的,能力也是比较开放的。百度账号登陆这个平台(xiling.cloud.baidu.com)就可体验。
当前,数字人使用的用户量、应用场景还是比较广泛的。除了一般性数字人的制作以外,目前曦灵也在探索如何把大模型技术在数字人场景里面用的更加深入。有了大模型的技术加持,才能给数字人灌注灵魂,否则数字人只是比较简单的皮囊而已。
现在,大模型它已经具备了人类理解的平均水平,你只要输入对数字人的想象,就能帮你生成你需要形象的数字人。为什么说数字人现在的应用才刚刚开始,一个很大的原因是数字人生成的门槛、成本还是不够低。未来在几分钟生成你的数字人,成为你的分身,帮助你做需要花时间重复性做的工作,应用场景一定会进一步打开。
在6月份,百度智能云会有直接用文字生成3D超写实数字人,以及上传一张照片克隆自己数字人的产品、平台推出,也欢迎大家关注。
智能客服做了很多年,坦率来说到现在为止智能客服还是只能解决简单的问题,比如打运营商电话的时候,问一问话费余额,智能客服能够解决。问一个复杂问题,大部分智能客服还是不能解决。机器人BOT对语言理解还是差很多,但智能客服需要你的回答是非常准确的,不能有幻觉。
这个情况怎么做?不是简单用大模型做一个知识库。大部分的情况下,在非常严肃的智能客服场景中,并没有太多厂商可以做到。百度基于文心一言强大的能力,在过去一段时间升级了百度智能云客悦,提升了知识库构建等效率,可以更强的直接代替复杂任务完成。
我们在这个例子中可以看到整个聊天的过程,基本上可以达到随你怎么聊、随你怎么刁难,话都不会掉到地上,帮助你完美把这个事情解决。近期我们跟一些大型企业、呼叫中心交流过程中,他们还是比较感兴趣的。期待这个方面的前景随着实际场景落地,大模型在这个领域的应用价值空间会慢慢打开。
可以看到,它非常自然地对问题进行描述,比如说汽车有一些响声,通过非常口语化的描述,客服机器人也能够准确去做初步的判断,对话过程基本上可以模拟人跟人的对话。拿给客户体验,随便怎么问,随便你从什么角度刁难或者讲,整个客服服务沟通的体验是非常好的。这里面还有很多问题的优化,包括速度的问题,怎么更快地把一些场景构建出来,相信这也能让大家看到未来的潜力。
百度智能云甄知,大家都知道,对于密集型大企业知识管理是刚需,有了大模型以后,对模型处理能力,在搜、推、问比较典型的应用方面是有大幅提升的。我们看到,知识管理也是大模型在企业落地的第一个堡垒,这一块的商机、实际推进项目是比较多的。比如我们跟南网科研院合作,在企业知识协、管、用、编等各个环节通过大模型提升效率,时间问题我就不再展开。
在企业内部有大量分散的信息,我们称之为烟囱、孤岛。有了大模型,通过自然语言的方式调起各种应用,过去在管理信息系统领域没有很好解决信息孤岛的问题,有了大模型完全可以解决,像这样的我们叫做超级助理,结合企业应用场景把知识和任务各种类型都通过总的接口去完成。
百度GBI,为数据分析师的工作做相当部分的替代,Agent架构可以把数据分析师的工作可以分解为一个个任务,任务有相当的通用性,当用户去提关于数据分析通常性的问题,不仅可以对当前问题进行总结、分析、提炼,还可以结合他对问题领域的知识和理解,提供可供参考的意见,在这个方面像我们的产品GBI,大家在线上都可以直接体验,所有产品都已经SaaS化了,对用户非常友好,我们的产品是全面开放的,欢迎跟业界的其他厂商更好的交流。
Baidu Comate智能编码助手,我们支持各类型的IDE和语言,包括推荐准确率、速度、安全保障方面都是做的非常好的产品。面向程序语言、极度结构化语言进行撰写和纠错等是大模型最好的应用场景,我们相信大量的程序员都有可能被这样的工具进行赋能,在效率上有大幅提高。
Baidu Comate结合已有的知识库进行自动编程,包括对老的代码自动进行解析,包括程序员在坚守老的代码,可以更快开发新任务。
在这几个方向,我们可以看到大模型在B端应用正逐步展开。把大模型的能力,在企业内部的各个环节真的用好,一定代表着新的生产力方向。我们也期待跟各位朋友、业界同仁、生态伙伴都可以进行交流,我们共同努力把这些大模型能力更好地应用起来。今天这个会叫AI Partner,百度智能云也希望跟所有的客户、伙伴都成为Partner,在大量场景里展开适配和合作,在合作深度、广度上有更大的释放。谢谢。
文章来自于“腾讯科技”,作者“李然然”
【开源免费】Fay开源数字人框架是一个AI数字人项目,该项目可以帮你实现“线上线下的数字人销售员”,
“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。
项目地址:https://github.com/xszyou/Fay
【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。
项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file
本地安装:https://www.deepbi.com/
【开源免费】airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。
项目地址:https://github.com/hitsz-ids/airda
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales