# 热门搜索 #
搜索
一口气升级7个大模型SaaS应用,百度智能云:突出一个“开箱即用”
5356点击    2024-03-27 17:31

这一波大模型产业落地浪潮里,不少企业其实处在 “干瞪眼“的状态。


一种情况是,很多大模型产品看得见却摸不着,在台上一个个遥遥领先——今天Sora技精四座,明天英伟达的机器人又赢得满堂彩,可是到了台下一问:啥时候能用上啊?答曰:遥遥无期。


另一种情况是,企业想用上大模型,却又难免瞻前顾后——既要考虑场景融合,又得兼顾安全性,还要考虑打通现有系统,再加上各种部署成本和繁琐的采购流程……最后只能拂袖:罢了,再等等吧。


所以对大模型厂商来说,让企业尽快用上企业级大模型应用,是加速大模型产业落地的关键。


为此,百度智能云最近一口气升级了7个大模型企业级应用,并且全部推出SaaS版本,突出一个“开箱即用”,涵盖了企业目前最常见的几种大模型使用场景。


什么部署啊,调用API再开发应用啊,根本不需要的。


我们也第一时间冲到了发布现场,感受了一下这7个大模型应用。


为了方便理解,我把它们分为两类:对外营销类对内提效类


先说说对外的:


跨模态营销物料生产


首先是号称能实现 “跨模态营销物料生产”的百度智能云“一念”。


文生图、图生视频、文生成视频……(各种排列组合)统统不在话下,营销文案、海报都能轻松拿捏,支持视频混剪、生成数字人视频,还能无缝衔接企业现有的平台和营销物料


发布现场做了这样一段展示:给它一段提示词,就能用之前拍好的视频素材制作出符合描述的汽车广告短视频:



创作完成后,“一念”还能自动给内容打标签,写摘要,生成的内容可以直接分发至多个平台,连发布的功夫都给省了。


市场部同事看了表示:这个鱼,一时半会儿是摸不完了……


大模型加持数字人


如果说过去的数字人空有一副皮囊,那大模型的出现真正为数字人注入了灵魂。


百度智能云的曦灵数字人在做直播时不仅可以自动生成、改写营销话术,还能让数字人回答直播弹幕,跟直播观众互动



以后说不定大家可以组队去直播间撩数字人主播小姐姐,就奔着这颜值,多少也得买点儿不是么~


那怎么获得数字人呢?


可以根据真人录制的视频来生成对应的“数字分身“,再用大模型生成的话术来驱动数字人做出完美对应的身体动作和脸部表情。


据介绍,在曦灵数字人平台上传视频和声音文件,经过一定时间就就可以生成一个 “数字分身“。


比如这位老师用“数字分身“来替代真人录制课程,课程制作成本只有之前的30%,效率提升整整20倍。



不仅音色高保真,还可以自动去掉重复话术,让讲解更流畅自然。


还可以3D捏脸


在没用上大模型之前,制作一个数字人需要专业人士用专门的软件捣鼓半天,现在只需要输入几句话,就能制作出符合要求的数字人,效率明显提高,成本和门槛也大大降低。


比如让大模型:“生成一个茶文化的代言人,国韵古风,灵动俏皮,有张曼玉和林青霞的古典之美,也要有年轻一代的活泼。”


大模型就会开始“思考“这些描述对应的是什么脸型、发型和五官参数,并捏出符合要求的样子。



这些数字人不仅能用作形象代言人,还可以在电商、文旅、媒体等各个领域发挥作用。


大模型重构智能客服


智能客服是目前企业使用大模型最典型的场景之一。


百度智能云用大模型全面重构了智能客服平台客悦,据介绍:用户问题的自助解决率提升至90%以上


过去人们打客服电话,总想着第一时间“转人工“,因为过去”人工制障(制造障碍)客服“常常听不太懂”人话“,只能捕捉对话中的关键词,用提前设置好的话术来对付。


比如上一代智能客服问你:“几个人入住酒店?”你说:“就我自己。”它可能就听不懂,非得你说“一个”才行,回答格式也非常模式化。


而大模型加持的智能客服,拥有更复杂的语义理解、更准确的推理计算和更直接的多轮回应。


简单来说,就是更能听懂人话,也更会说人话,服务更自然。


发布会现场用汽车行业售后服务举了一个例子。


智能客服先是自动调用内部系统数据,得知客户已经很久没有保养过车辆,于是提醒预约保养


即使客户用 “吱吱的声音”这样口语化表达来描述车辆异响状况,客悦平台的智能客服也可以理解



根据客户描述的车辆故障症状,大模型可以推理并调用知识库车书,进行初步判断并给出具体建议,最终协助完成检修预约。


除了在线文字客服,目前客悦平台也支持电话客服。


据百度智能云介绍,大模型加持的客悦整体运营效率比上一代客服系统提升6倍以上。


讲真,其实人们才不关心客服是人还是AI,只是想解决问题,但愿这一次大模型能帮“人工智能客服”一雪前耻。


接下来是 “对内提效“的部分。


大模型辅助编码


辅助开发者写代码,依然是企业内部用大模型提升生产力最明显的场景之一。


在写代码的过程中,传统模式完全依赖人工,而Baidu Comate基于文心大模型,可以理解编程语言、理解代码上下文、理解注释,并自动生成新的代码,支持自然语言人机交互,提供高质量的代码建议。


据介绍,Baidu Comate正式升级至2.0,不仅在代码生成、单测设计与生成方面能力更强,还新推出两大重磅能力。


Comate可深度解读企业与个人私域代码库,开发者不仅能向它询问和代码库任何有关问题,比如:“当前代码的架构是啥?”、“鉴权逻辑是怎么实现的?”,还可以挂载专属知识(比如把公司的开发文档、需求文档、API文档挂进去),让Comate按照文档描述来直接完成需求拆解分析,快速生成新代码,减少大量人工阅读和理解开发文档的时间。谁不想拥有这样一个“私人研发助理”呢?




Baidu Comate 2.0也可将企业私域知识(如代码规范)、第三方能力(如GitHub、GitLab等)与编程现场深度结合,让生成结果更准确、完成丰富的操作,企业和开发者个性化的定制需求也可以更高效、低成本地自助实现。


据发布会介绍,Comate目前已经覆盖100多种编程语言,支持常用IDE,在百度已经有一年多的广泛使用,建议的代码超过40%被百度的工程师采纳,占正式新入库代码的25%以上,为百度研发全局提效10%。这样的数据效果也是Baidu Comate向更多企业和开发者提供服务的信心。


这次百度智能云更是直接宣布全新升级的Baidu Comate2.0编码辅助工具面向个人开发者免费。


这都开始用免费来抢占市场了,看来以后人机协作编码已是大势所趋。


知识管理和超级助理


知识管理是另一个比较典型的大模型使用场景。


每一家企业本质上都是一个不断累积的庞大知识库,而大模型天生就适合跟知识打交道。


百度智能云用大模型全面重构出了一站式知识管理平台“甄知”。


从知识生产到加工,到组织,再到获取和应用,大模型全都能发挥作用,而且能打通公司各个业务部门信息,将企业内部知识库真正“盘活”。


以南方电网集团为例,员工可以用甄知辅助编写企业标准等各种内部文档,生产的知识可以被搜索到,并自动推荐给有关同事。


员工们还可以用对话的方式,就相关知识向甄知提问。



此次百度智能云还发布了一个叫超级助理的应用,可以对接各种系统帮人们查询和办理各种事项,也就是前阵子挺火的AI Agent。以后,一个超级入口,一句话,就能完成各种事了!


生成式“商业智能”


还有一个典型的大模型使用场景是BI(Business Intelligence,商业智能)


传统BI在取数制表、查询计算、分析可视化等各个环节,都依赖人类商业分析师的专业技能和专业工具,难以快速处理临时的分析任务。大模型+BI,为这些难题带来了全新的解题思路。


百度GBI作为国内首款生成式商业智能产品,基于企业级智能体,无需一行SQL,通过自然语言提问,就能完成查询、绘图、归因、预测、洞察、总结等全链路数据分析任务。


例如一位店长面对一份无从下手的数据表,只需提问“去年热销的商品品类是什么”、“想要提高利润,我应该加强和哪些供应商的合作”,百度GBI就可以结合分析需求自动解析数据。


百度GBI让非专业人员也可以轻松获取数据洞察,将数据分析、撰写分析报告等工作缩短到分钟级。极大提升效率,帮助企业决策快人一步。



据介绍,以上7个大模型企业级工具都已经全面SaaS化,公有云在线可用,也支持私有云和本地化部署,“大模型应用全家桶”搭配食用风味更佳。


通过这7个大模型企业级应用,我们可以隐约看到,大模型已经开始融入到企业内部管理和对外营销的方方面面。


不难设想,未来不论何种类型的企业,人类和人工智能助理协作都大概率会成为一种常态,就像人们已经习惯使用电脑、智能手机。毕竟,连微软公司都已经在键盘上专门设计了Copilot按键,而苹果公司也计划在新iPhone中引入大模型。


因此,选择什么时候开始适应这种新的工作生活模式,将会是每一家企业,每一个人需要回答的问题。


本文来源于公众号 凹非寺,作者允中





AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
数字人

【开源免费】Fay开源数字人框架是一个AI数字人项目,该项目可以帮你实现“线上线下的数字人销售员”,

“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。

项目地址:https://github.com/xszyou/Fay

2
AI数据分析

【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。

项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file

本地安装:https://www.deepbi.com/

【开源免费airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。

项目地址:https://github.com/hitsz-ids/airda

3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

4
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT

5
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0

6
无人直播

【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales