# 热门搜索 #
搜索
Agent云服务,不止做平台|量子位·视点 x 汇智智能
5779点击    2024-06-15 15:26

AI Agent热度不低,但是企业真的在使用智能体了吗?


为了更加了解AI Agent落地现状,量子位·视点邀请到了汇智智能联合创始人樊刚正,一同来交流AI Agent正在以什么样的方式与具体场景相融合。


樊刚正与我们分享了Agent公司来自实践一线的观察与思考。从本地生活+AI,到AI教育,再到分别面向C端和B端的智能体平台,汇智智能围绕Agent的落地做了不少的尝试探索。


那么AI Agent的价值点在哪里?最适合AI Agent落地的场景是什么?一线用户对智能体需求的真实反馈是什么?


以下在不改变原意的基础上,根据分享内容整理成稿。


技术的引入需要解决实际问题,而非增加复杂度。
先考虑做单点突破,再去考虑做泛化通用。
不是去造飞机大炮,而是要在AI商业化中造子弹。
企业内部能最先能用好的Agent,比如像在钉钉、飞书这种企业协作工具里。


今天在分享中,我更倾向于向大家去呈现:我们在Agent落地方面经历了什么样的探索,然后在落地探索中,我们吸取了哪些经验。我觉得这个实际业务当中的一些经验,可能对于大家来讲更有启发,也更有价值。


汇智智能最早是做本地生活,还有游戏相关的业务。所以最初我们转向做AIGC的时候,也尝试过和我们过去的业务做一些结合。



我觉得任何从传统业务,或者从互联网行业转型做AI的公司可能都会经历过这样的步骤,先去考虑AI和我原有业务怎么去做结合,然后再想如何仅基于AIGC去做产品。这也就是从应用+AI到AI原生的这么一个路径。


技术的引入需要解决实际问题,而非增加复杂度


最早汇智智能做的小程序是面向本地生活商家,主要是为用户提供运营管理的工具,通过抖音MCN,以派单的方式给达人一些线上任务。


加入AI大模型后,我们先后推出了旺氪小程序和智能体AI小程序。除了接单派单的功能,还加了内容生成的工具化服务。比如说用户可以在小程序里生成门店图片,或景区风景合影照片。当时上线了非常多的插件类工具,我们在内部把这个叫做智应用。


但在这个过程当中,我们发现:即使有一些流程指引,商家反馈的使用效果也不是很好。加了AI的功能之后,部分视频是AI生成的,部分文案是AI生成的,但对商家来讲,他们觉得步骤变多了,但我拿到的东西还是和过去一样。


在一开始转型做AI业务的时候往往会发生这样的问题,想当然地认为可以用AI去改造现有的生产环节,或者认为这能够替代一切原有的内容生产。但实际使用时会发现,ROI并没有想象的高。


在应用AI时我们需要谨慎,特别是在没有颠覆性创新之前,技术的引入必须真正解决实际问题,而不是增加复杂度。


另外我也给大家一个建议,就是先考虑做单点突破,再去考虑做泛化通用。过于泛的场景应用容易导致各个场景只能拿到60分,但对用户来说,如果你只能在一个场景中解决60%的问题,其实解决0%的问题没有区别。


AI教育与人才培养的尝试


在上面的尝试中我们也发现:AI的转型落地依赖于相关人才来完成最后100米的落地部署。这种人才在国内来讲是比较少的,真正能称得上是大模型工程师的人其实不多,这也导致项目落地时,没办法提供很高的交付能力。


所以我们希望为市场培育更多人才,这对整个行业都是有价值的。于是我们想把过去内部业务培训的内容,拿出来做成对外的课程。但它也没有太强的生命力。


因为在没有积累丰富的AI落地案例的时候,课程更多偏大模型本身的技术学习。所以面向的学员群体非常窄,推广难度大,没有能够吸引很多人来加入这个行业。另外,教育内容的研发和推广周期长,导致课程上线时已落后于市场需求。


我们的经验是,AI教育应从业务中自然生长,当有足够多的经验案例时再推向市场。同时,教育对象应是可以转化为业务伙伴的用户,而不是C端用户。对于业务平台来说,直接参与知识付费业务没有那么合适,应该谨慎对待。


Gnomic与Agent云:C端与B端的融合


在几次业务尝试之后,我们重新思考了汇智智能在大模型生态中的定位——我们将自己定位在应用框架层,合作伙伴属于垂直应用层。


目前汇智智能的业务架构是B端和C端融合的结构。我们目前主要的两个智能体平台:Gnomic平台面向C端创作者,提供定制化的智能体创意、分享与推广服务。Agent云则为B端企业提供AI数字员工解决方案和云服务,帮助企业优化成本、提升效率,提供决策支持。



截至今年5月底,Gnomic平台拥有超过500万用户,原创智能体数量达7万多个。像AI小王子、南瓜博士,还有数字生命卡兹克,都是我们最早一批内测用户。


Gnomic平台面向的用户群体很广泛,我们可以通过这些智能体去观察,有哪些场景适合我们做深入的业务探索。比如目前有3万+休闲娱乐相关的智能体,例如角色扮演等,还有2万+与工作学习相关,2万+与金融和商业相关。



我们所有的智能体支持转发或部署到微信公众号、抖音号中,让我们平台的能力变成创作者在个人平台里的能力。我们也会帮创作者做一些推广,分享创作者作品让更多人看见。希望能够做到「与AI热爱者同进,与AI创造者共赢」。


Agent云平台的定义是企业级的AI数字员工解决方案与云服务平台。区别于过去的数字员工,Agent云定义的AI数字员工更突出与大模型结合带来的新价值。具体有五大用户价值点:


  • 永生数字员工:每个智能体都会保留长期的工作协作记忆


  • 一分钟购买即用:从购买到部署到空间,可以在一分钟之内完成


  • 企业知识管理:帮助企业搭建自己的行业专家级知识库


  • 智能体工作流:多个智能体在复杂工作流程中实现人机协作


  • 自研AI技术栈:可以持续为用户提供有升级演进能力的技术服务



自研技术栈增强对技术的掌控力


汇智智能拥有自研大模型CarrotAI,预计今年下半年可通过备案,向公众提供大模型服务。


有很多合作方和生态合作伙伴问我们,为什么作为平台层公司,还要做自己的大模型?


因为我们觉得,如果只是做平台层,往往会陷入身不由己的境地。最近大模型在大降价,相比直接我们的接入成本降了很多。但是对我们而言,成本可控比成本低更重要。


而且,当我们熟悉从数据标注到预训练的大模型开发全过程,再到最后微调、部署,我们自身也会有更强的技术掌控力。面对客户的需求时,我们都可以通过自己的技术栈做快速的切入来提供服务。



我们希望通过Agent云平台,能够让智能体成为企业组织的新基建。


面对更多的场景,仅靠汇智智能来承载是不够的。这里为大家呈现的是,汇智智能生态合作伙伴的运营体系——城市运营中心。



最终我们希望通过汇智智能的大模型创新能力,为合作的城市运营中心提供技术上的赋能。让身处于行业中的生态合作伙伴,去交付具体客户。


比如像金融行业的客户需要智能体业务,我们自己去了解行业再做成定制化产品,就会花费比较长的调研、开发时间,而对于金融行业的合作伙伴而言,就容易得多。我们将底层技术提供给金融行业的合作伙伴,由他们完成实际交付。相当于把汇智的能力复制出去了。


我们这段时间也正在招募城市运营中心的合作伙伴,非常欢迎大家联系我们交流合作。


以上就是我们目前在AIGC商业化探索中的一点经验。


企业协作有可能最先用好AI Agent


Q:在目前汇智智能的观察中,在哪些场景或什么样的工作,是Agent能够完成得更好更优质的呢?为什么企业可以用Agent来代替原有的工作流?


汇智智能樊刚正:在Agent云中上线的智能体,大多数都是用于企业内部协作的场景。我们觉得在企业内部能最先能用好的Agent,比如像在钉钉、飞书这种企业协作工具里,在内部平台去加上智能体业务。


Q:目前汇智智能有哪些具体落地的案例,可以与大家分享?


汇智智能樊刚正:其实还挺多的。比如我们之前与江苏的一个国企合作,提供企业内部的协作服务。他们作为一家大企业,旗下有400多个子公司,内部协作时有许多各部门共享的文档,和需要同步的会议信息。


我们为他们定制了内部使用的智能体平台。在平台里,可以创建不同部门的智能体空间,每个空间的智能体都对应了具体的员工,员工平时可以把日报和周报发给智能体。时间一长,对应的智能体会非常了解这个人在做什么,平时在解决什么问题。


如此可以实现以下两种场景。一个是记忆的传承,当原来员工离职后,新员工可以继承他的智能体,遇到问题就可以向原来员工的智能体询问。还有一个是记忆的共享,用户可以调用不同身份的智能体。当该身份员工不在时,可以向他的智能体寻求建议。智能体就像是一个员工的数字分身。


当智能体平台与监控摄像头相结合,还可以做到预测功能。比如过去火情监测是靠烟雾、火苗的识别来做预警,那么通过监测环境中的易燃物,可以提前预测火灾的可能性,同样也可以预测火情的原因和适合什么设备来灭火。类似的监测还可以用于校园霸凌的场景,比如发现多个学生围着某个孩子时,就可能存在校园暴力的场景。


Q:那就您的观察,目前智能体的用户比较关注的Agent的功能是什么样的呢?


汇智智能樊刚正:不同行业有不同关注的价值点。主要集中在三个方面,一个是快捷、一个是可塑,一个是性价比。



比如我们和一个咨询公司的合作。对方主要是为企业提供数字化转型咨询服务的。当用户问他们有没有AI平台可以使用时,他们就只能推荐使用智谱,或者月之暗面这些平台。那么,现在我们提供了定制化智能体平台OEM服务,他们可以直接对客户企业说:可以直接使用我们的平台上的智能体产品。对于这样的用户,他们关注的就是平台的快捷、可塑。


有的公司需要单独做具备智能体功能的小程序开发,我们就提供了比较有竞争力的服务价格。对于生态合作伙伴,在开发费用、算力费用上都有不同程度的优惠政策。相比企业自己去搭技术栈做这样一个平台,我们可以节约95%以上的成本。


Q:那么像现在大模型迭代也非常快,那么智能体产品是否需要始终适配最新的大模型呢?


汇智智能樊刚正:不是这样。以C端的视角来举例:假设我是一个提示词创作者,过去在ChatGPT上面创作了很多有意思的提示词,但当把这些提示词搬到智谱,或者月之暗面的模型上面时,发现效果和GPT回答的并不一致,因为他们本身的能力是不一样的。


那在企业端也是这样的问题。比如已经把智能体配置得很好,基于某种模型做了测试,调试后达到了一定的效果。如果有什么最好的模型马上做更换的话,那相当于提供的服务其实是不稳定的。可能换了参数量、能力更强的模型,但不意味着一定能做更好的服务。我们更倾向于在这个场景下,当模型已经能实现用户要求的时候,一般就不会做更换。


这也是去年行业里一个普遍的误区,就是模型越大越好、模型一定要参数量越高越好。其实不是这样的。小模型,相对来讲更可控,而且成本更低,我们去做运营的调试成本也会更低。对于用户来讲,也能够做更多定制化的东西。


Q:还有伙伴比较关心,如果用Agent来作为数字员工的话,涉及到任务的解答或者知识的继承,对于准确性还是有一定要求的,汇智智能如何看待智能体的数据准确性呢?


汇智智能樊刚正:数据准确这方面,其实有很多策略可以来解决。大家知道大模型有幻觉问题。比如大家关注的AI搜索:以前用大模型回答问题时,很难避免不出现幻觉。而AI搜索的逻辑是:用户输入问题后,后台调用搜索的插件,比如Bing的插件去看搜索出来的结果,然后根据这些结果的文本内容进行总结,再回答你。


我们也可以在知识库的层面去避免这种问题。如果你发现想提供给用户的服务,在知识库里没有,互联网上也找不到,那我们可以帮企业做信息上传,进行知识库的处理。


我们还可以在提示词里做避免幻觉的提示词策略,比如要求AI回答的任何问题,都必须通过知识库或互联网连线去检索回答,并提供依据。


另外。技术本身是有自己演进过程的。我们现在也很难信任智能体来完成一些具体的金融行为,比如让智能体帮我付钱。比如订单点菜的智能体,万一产生了幻觉,付款付多或者付少了怎么办?


所以我们需要有长远的技术视角。现在在某些场景下,智能体已经可以比较准确地解决问题,但是在某些要求特别精准的环境里,我们可能要期待未来的技术来解决这些问题。


文章来源于:微信公众号量子位,作者:允中


关键词: Agent , AI Agent , Gnomic , 智能体
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

2
AI数据分析

【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。

项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file

本地安装:https://www.deepbi.com/

【开源免费airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。

项目地址:https://github.com/hitsz-ids/airda

3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

4
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT

5
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/

6
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner

7
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0