相较于API模式,RPA模式Agent的优势则在于对系统的无侵入。
36氪获悉,近日实在智能宣布完成近2亿元C轮融资。本轮由金泰富资本和安吉智慧谷共同领投,安吉两山国创跟投。
此前,实在智能已完成六次融资,投资方包括穿越基金、君联资本、松禾资本、赛智伯乐、聚数银资本、中赢资本、光云科技、卓源资本、英特尔资本等多家行业头部投资机构及上市公司。
成立于2018年8月,实在智能从AI+RPA(机器人流程自动化)领域发轫,迄今已为2000余家数字政务、运营商、金融、能源、交通等领域大型客户部署各类“数字员工”。
所谓的RPA(Robotic Process Automation),产品形态通常为一套自动化软件,帮助解决重复、流程、规则以及需要在不同系统或传播介质中切换的工作,模拟人类对各类OS及应用软件的操作。
从RPA赛道起家,实在智能已经创新推出了两代产品。第一代产品结合了自研的“融合拾取”技术,实现了机器人对各类PC软件界面元素的精准识别;在第二代产品中,实在智能推出了“智能屏幕语义理解技术”(ISSUT)和IPA(智能流程自动化)模式,将传统RPA的“组件拖拉拽”的专家模式改为“鼠标点选用”的小白模式,降低了“数字员工”商务应用门槛。
2023年,随着AI理解能力在大模型上实现了跃进,实在智能推出了第三代产品:“大模型+RPA”的Agent(智能体)。
在实在智能CEO孙林君看来,从RPA过渡到Agent是顺理成章的升级过程。他告诉36氪,RPA的形态是将设计好的任务导入到机器人中,再将单个或多个机器人部署到企业的系统环境中,用一个中台加以控制。这种分布式的、可扩展的部署形式,又非常适合AI智能助理。
自2022年起,实在智能就在探索“一句话生成流程代码”的技术,但当时的预训练模型还不具备很强的业务理解和推理能力。而以ChatGPT为代表的大语言模型的出现成了RPA转型为Agent的契机——从2023年3月份起,实在智能开始基于大模型做“智能助手”产品的研发。
出于B端客户数据安全保护的需求,实在智能选择自研基座大模型。2023年8月16日,公司发布“塔斯”(TARS)垂直大语言模型。孙林君告诉36氪,TARS的特点在于被投喂了大量的自动化流程数据,这有利于TARS对客户业务流程的理解和拆解。
而实在智能的Agent,基于的不仅是基座TARS,还结合了视觉理解技术ISSUT与RPA技术。
主流的Agent调用,主要采取的是API(接口)模式。然而对于系统设计而言,对外暴露的API越多,安全风险越高。孙林君解释,“系统的设计原则是‘高内聚,低耦合’”,即用大模型去构建Agent时,软件暴露的API越少越好。
相较于API模式,RPA模式的优势则在于对系统的无侵入。通过结合ISSUT技术,RPA能够对人类操作系统的行为进行模仿,并通过识别屏幕上的软件进行操作,全流程不会对系统和数据造成任何损害。
“首先要认识到Agent的能力是有边界的,不能把它当做能解决任何问题的AGI。”孙林君将Agent看做一个具有特定角色的“数字员工”,“目前To B领域是Agent可交付的场景,因为岗位很细分,定义也比较明晰。”
实在智能计划在2024年初,对Agent进行市场公测。针对个人用户,实在智能将推出解决长尾、低频自动化需求的PC助理,针对政府企业,公司则计划推出员工办公助手。
随着AI技术的开源和入局者的增加,Agent赛道的竞争也将加剧。孙林君认为,对于RPA企业而言,对行业的Know How、产品的ROI(投入产出比),以及技术创新能力,将是核心竞争力。
官网地址:https://www.ai-indeed.com/
文章来自 ”36kr“,作者 周鑫雨
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md