“大模型元年”下半年,话题焦点,已经显现出从技术向的基础模型,向“agent(智能体)”这样的应用关键词转移之势。
从各家大模型厂商最新卷出的花样中,亦可见一斑——
刚刚,百度智能云就率先露了一手:分分钟,打造一个“面试官”智能体。
这样的能力,来自今天百度智算大会上重磅展示的“百度智能云千帆AppBuilder”,一个可以高效开发AI原生应用的工作台。
只见百度智能云技术委员会主席孙珂一键点击,一个具备人设,自带代码解释器、问答以及文生图能力的Agent就自动创建完成了。
只需要输入“角色指令”,再选一下代码解释器等插件工具,“面试官助手”当场就能上线干活。
具体能做什么?就像这样,直接抛给它一份简历,这个智能体就能根据岗位描述,帮HR划好重点,从5个维度给候选人简历打分并做出评价。
还能进一步提出需求,画出候选人能力雷达图、推荐面试问题也不在话下。
甚至还会自动贴心地帮忙写上保存图片的代码。
没错,打造这样一个智能体,不要3个月,不要3个星期,甚至分钟级就能实现。
如果觉得简单的低代码图形界面还不够定制化,千帆AppBuilder还提供了更“黑科技”的代码形态。
通过各种组件的自由替换组合,程序员们可以按照自身所需,且同样高效地创建大模型应用。
在今天智算大会的现场,孙珂通过几行代码,直接从10份简历中迅速筛选出了最符合JD的候选人。
看这演示,是不是有点意思?我们还探听到,不只是agent,大热的RAG(检索增强生成)、GBI(智能数据分析),都能基于这么一个工作台快速实现。
话不多说,我们当然是第一时间进入千帆AppBuilder官网进行了测试,亲睹为快~
第一轮实测,先来试试用“RAG问答应用”打造一个“量子位小助手”到底难不难。
所谓RAG(检索增强生成),是指将生成模型和检索模块结合起来,让生成式AI能从外部知识源中获取信息,以提升准确性和可靠性的技术。
以打造“量子位小助手”为例,采用RAG框架,我们不需要微调模型,只需要给大模型准备一些量子位内部参考资料,让它能在面对提问时“开卷”作答,大模型就能更准确地回答一些特定领域问题。
实际操作中,点击界面中的“上传知识”按钮,导入任意知识文档(支持.doc,.txt,.docx,.pdf四种格式),就可以创建自己的知识集合了。
在简单投喂了一些量子位智库报告和内部知识文档后,一个RAG应用不到5分钟就创建完成了。我们正式进入测试环节。
需要说明的是,为了验证打造这么一个RAG应用到底能有多“傻瓜式”,本次上传的文档没咋处理过,给人看是啥样,给大模型看就是啥样。
Q1:量子位提名的年度十大科技趋势是什么?
回答得很准确,相比于文心一言4.0基于网络搜索给出的答案,更加详细。
再来进一步问问一些技术细节呢?
面对“3D生成的主流技术分为哪几类”这个问题,分钟级速成的“量子位小助手”给出的答案是酱婶的:
跟通用版大模型对比,在参考了量子位内部的知识文档后,量子位小助手能回答得更有针对性一些。
我们再来加大难度,问问这个小助手一些“百度”不到的问题。
比如,量子位的编辑同学每天早上该怎么看选题?
看着架势,老板再也不用担心我不好好学文档了。
同样,一些提升效率的技巧,速成版“量子位小助手”也妥妥掌握。
这一波测试下来,我只想对这位AI同事说:
在智能体和RAG之外,在百度,BI(商业智能)也已经被大模型重构。现在,全新的GBI(智能数据分析)能力也被放到了AppBuilder上,开启了小范围测试。
简单来说,GBI主打一个“聊天搞定一切”:用任意问题询问任意一张或多张数据表,快速得到结论。
打个比方,老板要求10分钟之内处理海量数据,给出精确的成本估算,甚至要根据分析结果做出决策,该怎么办?当然是交给大模型来算~
具体创建过程跟RAG一样,通过简单的图形化点选就能完成,主要分为三步:数据源接入、选择数据范围、开启智能分析。
接下来,提问测试就完事儿了。即使是复杂问题的洞察分析,也能快速完成。
另外,这个GBI框架还支持专业知识注入和复杂计算逻辑,可以满足更高级的分析需求。
一番测试之后,是不是觉得百度智能云的这个AppBuilder确实有点东西?实际上,我们的实测还只是体验到了其中比较基础的一部分功能。
不难看出,AppBuilder其实是百度把自己开发大模型应用的经验和工具,沉淀成了一个工具完备的工作台。
具体来说,这个工作台主要由两部分组成:应用组件+应用框架。
应用组件,主要是云和AI能力的组件化封装。其中包括:
应用框架,则面向具体的场景任务,是应用组件的串联组合。目前,百度智能云在AppBuilder里提供了以下几种常用的AI原生应用框架:
就是说,在应用框架里,百度智能云提前把构建agent、RAG这样的AI原生应用所需要的AI、云能力都打包好了。就像我们实际体验的那样,开发者甚至可以一行代码都不写,开箱即用。
除了“快”之外,此前,百度集团执行副总裁、百度智能云事业群总裁沈抖之前还透露,搭建这样一个RAG“助手”,即使需要处理几千篇万字长文档,成本也只需几百块钱;之后用户每次咨询,成本仅为几分钱。
中天钢铁也基于Agent框架,打造了智能化的“企业调度中枢”,实现了任务指令的自动感知、分解和执行。
比如,在发现钢铁产量不达标时,只需提问一次,大模型就可以自动调用平台纳管的各种资源和API,找出未达标原因,及时调整排产计划并发送邮件通知调度人员。
值得一提的是,除了应用框架这样的“低代码态”服务,AppBuilder还为开发者提供了“代码态”服务:提供可编程的全套开发套件,包含调用组件的SDK、开发环境和相关调试工具。
孙珂博士还介绍了这套“低代码态+代码态”开发组合拳中一个值得关注的细节:
低代码套件除了能够让开发者快速地试验应用效果之外,其中的代码解释器模块还能够根据任务需求写代码,这些代码都是直接可获取的。
参考这些代码示例,程序员可以在代码模式下自行开发调试,或者替换成任何自己想要的应用组件。
这就意味着,程序员们可以进行更深层次的AI原生应用开发,把自己的创意更充分地展现出来。
百度卷AI原生应用这事儿,其实早已有迹可循。
百度CEO李彦宏就不止一次发表观点:在基础模型之上,要有千千万万甚至数以百万计的AI原生应用,大模型的价值才能被体现出来。
就如同移动互联网时代的iOS/Android,和杀手级App微信、抖音之间的关系一样,基础模型的最终竞争者可能只有三四个,但在此之上的应用市场,实际上蕴藏着更大的创新空间和潜力。
这样的观点,如今正在行业中激起更广泛的共鸣。
趋势已然显现,但百度作为最早的躬身入局者,也在实践中发现了新的问题:并不是所有应用需求都能通过简单的prompt实现,在大模型与AI原生应用构建之间,存在工程设计、策略设计、定义接口方案、集成等等复杂过程,还需要配合大模型使用语音、翻译、图形等能力和完备的开发环境。
孙珂博士对我们解释说:
一个agent如何搭建?这个问题我们问了很多开发者,他们真的不知道。
拿一个应用框架举例,要保证大模型输出的稳定性、可控性,需要写一些复杂的prompt,还需要去和外部功能做结合。
大模型想要做出第一款“愤怒的小鸟”(爆款应用),中间需要一系列AI原生应用的开发套件,帮助所有开发者能够更快速地了解大模型最深层次能做到什么程度的事情。这是目前对开发者来说非常缺失的部分。
而这样的问题,单靠提供大模型的MaaS接口,是远远不够的。
百度智能云千帆AppBuilder,覆盖大模型开发各种应用的常见模式、工具、流程,正是为了弥补这种大模型到AI原生应用构建之间的缺口。
正如孙珂所说,应用组件对于资深开发者而言,像是散装的乐高积木,大家可以凭借自己的想象,把整个场景搭建起来;而应用框架则像是乐高的场景版,面向更多普通开发者、非程序员提供搭建应用的示例,让更多人能使用框架快速地搭建起AI原生应用原型。
基于这样的一整套工具,目前开发AI原生应用面临的效率低、门槛高的问题就有了新的解决方案。
移动互联网时代App市场的爆发,离不开各种技术框架的基础支持,而现在,可以说千帆AppBuilder这样的工作台,也正在为大模型时代的“爆款应用”奠定基础。
大模型话题贯穿全年,但真正的变革风暴才刚刚起了个头。
现在,第一个机会点的舞台已经逐渐成型,新时代的杀手级App可以期待一波了。
p.s. 现在只需要进入百度智能云千帆AppBuilder官网,就可以体验所有的组件与框架了。
【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。
项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file
本地安装:https://www.deepbi.com/
【开源免费】airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。
项目地址:https://github.com/hitsz-ids/airda
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0