ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
对标GPTs但没有创建门槛,应用层的AI Agent玩家终于来了
8031点击    2024-01-09 16:29
从此在钉钉上,你只需要给出指令,其他事情交给「AI 助理」来办就可以了。


2024 开年伊始,大厂便开始卷 AI Agent 了。

 

过去一年,人工智能行业的风向标不断发生变化,最开始备受关注的是如雨后春笋般涌现的大语言模型及 AIGC 应用,接着又出现很多基于大语言模型打造的 AI 辅助应用(如微软 Copilot)。如今 AI Agent 成为激烈角逐点,是 AIGC 下一阶段的关键。

 

去年 11 月, OpenAI 发布 AI Agent 初级形态产品 GPTs,让人看到智能体的应用前景。谷歌、亚马逊在该领域也有所涉猎。比尔・盖茨认为 AI Agent 是 AI 的未来,并预言不久的将来,所有人都将拥有专属 AI 助理。

 

纵被百般看好,但不难发现 AI Agent 大都是开发者、极客和企业用户在玩,需要一定的专业知识,限制了在应用层面收获大量用户。这就要求厂商在推出 AI Agent 时,考虑如何将创建和使用门槛打下来。如果能在已有产品上直接创建,那当然更好。


1 月 9 日,在钉钉 2024 年度产品发布会 - 我的超级助理活动上,我们看到了理想中的 AI Agent。会上,用户数量已达 7 亿的国民级办公软件钉钉发布了全新 7.5 版本,并推出有机会对标 GPTs 的智能化产品 ——AI 助理,让每个人、每家企业定制个性化、专属超级助理。



大会现场,钉钉展示了直接在其平台上创建并使用 AI Agent 的「多面手」能力 —— 一切都在自然语言对话窗口中完成。


AI 助理可以完成钉钉系统功能设置,并预置了安排日程、处理待办、工作概览、消息摘要、请假审批、创作与文案润色、智能绘图等 30 多个功能,全方位提升个人工作效率。



设置会议铃声、打卡。


企业客户创建的 AI 助理能够连接自身业务数据,快速解决具体场景需求。


比如差旅场景中的「差旅智能问数助理」可以统计每月出差次数趋势、各部门每月出差天数等,大大减轻行政人员的负担。



差旅数据统计。


自定义是更大的发挥舞台,开发者除了选择预置的智能问答、图像生成、内容创作等官方 AI 能力,还能通过钉钉 AI PaaS 快速开发高级自定义 AI 能力。


此外,钉钉 AI 助理拥有跨系统任务行动能力,在获取外部平台的开放 API 后可以连接购物、视频、外部网站等各类第三方平台。AI 助理的能力不再局限于钉钉平台,钉钉会逐渐成为我们享受智能化服务的「第一入口」。


同样在差旅场景,连接差旅系统后可以订酒店、机票。对于经常出差的人来说,这可太方便了。




预订酒店。




预订机票。


AI 助理呈现了 AI Agent 的新玩法。在拥有海量个人、企业用户的钉钉平台上,通过官方预置能力支持的基础版和自定义能力加持的「Plus 版」AI 助理,每个人都能成为超级个体,每一家企业都可以使用专属 AI 提升生产力。


随着满足的场景需求越来越多,AI 助理成为了中国首个落地的「GPTs」,在 2024 开年为 AI Agent 赛道奠定了基调。


AI 助理如此强大、全面,要归功于钉钉赋予了它与一般 AI Agent「相同但又不同」的能力。


钉钉 AI 助理为什么值得看?AI Agent 的一种新切口


跟国外 AI 比,显然钉钉在底层大模型不如 GPT、Gemini 等,所以选择一个新的切口:找到自身擅长的丰富应用、企业数据,将之与 AI Agent 结合,对 AI Agent 进行增强。


如果说,OpenAI 用不可替代的 GPT 模型吸引开发者加入 GPTs 商店。那么钉钉的差异化在哪?丰富的应用、数据 —— 这是所有通用大模型暂时都不具备的特点。相比依靠 prompt 和多轮对话调优执行效果,钉钉的应用、组织关系等会对 AI Agent 的感知、记忆和行动能力带来有效的增强。


这也是为何钉钉 AI 助理可以「弯道超车」,带给用户不一样的东西:以对话形式对自然语言做出反馈,基于对个人和企业数据的了解进行规划决策,hold 住更多碎片化场景并完成复杂任务。


钉钉 AI 助理分为个人 AI 助理和企业 AI 助理。每个人可以创建多个具备特定专业能力的个人 AI 助理,比如工作、旅游、资讯、健身,还能跨系统执行任务,如前所示连接差旅系统。每个企业 IT 团队可以拥有不同领域的企业级 AI 助理,比如招聘、财务、生产,结合企业知识库和业务数据进行分析和洞察,实现跨应用、跨系统业务流程执行。


至于如何成长为这样一个多面手呢?在回答这个问题之前,我们有必要先来了解 AI 助理的设计理念。


如今想要用 AI 重做一遍的产品或应用大多采取 SaaS+AI 设计理念,将某项 AI 能力集成进来,支持的任务单一,用户面对的还是传统应用形态。钉钉立足于 AI + 原生理念,与大语言模型的结合迈入更深层次,通过拟人化的方式与 AI 助理交互,并打开了通向其他各种应用的超级入口。


因此,钉钉 AI 助理迎来全方位升级,拥有环境感知、记忆增强、推理规划和行动执行的丰富能力。并且在跨应用、跨系统执行任务时,与钉钉上丰富的场景、数据无缝结合,连接第三方电商、视频等各类外部平台。


长在应用场景中,AI 助理四大能力增强


首先是环境感知增强,AI 助理可以像组织成员一样被加入通信录、拉入群聊等,因而可以感知到用户及相关人的身份、岗位、职责和各场域上下文。与业务场景的结合使其在交互时感知到运行的场景,了解要解决的问题域。更精准的环境感知让 AI 助理在意图识别方面更有把握,有助于提升执行效果。


其次 AI 助理获得记忆增强,在交互中学习、融合个人或组织专属的数据。个人可以将文档、图片、应用数据、外部链接等各类数据按需加载为 AI 助理的短期或长期记忆;企业同样可以将自身数据资产作为 AI 助理的记忆存储库。海量碎片化个人数据和丰富企业级数据充当记忆,让 AI 助理在内容生成、RAG 知识问答、跨系统任务执行等场景中表现更出色。


AI 助理的推理规划也得到增强。AI 助理不是盲目而动,而是围绕用户需求目标对任务进行规划分解并调用相应技能来逐步完成任务。此外个人或企业的数据资产被钉钉用来训练专属大模型,通过监督微调让大模型吸收特定领域的知识、流程和规则,执行推理任务自然更拿手。


最后是行动系统增强, 通过与钉钉上开放的 API、连接器、生态应用、第三方应用和企业自建应用无缝连接,AI 助理打破「应用 / 系统」的边界,比如使用钉钉 iPaaS 连接平台从电商系统、视频平台拉取成交订单并导入钉钉多维表。



至此,大家应该明白了钉钉为何选择在其上构建 AI 助理:一是丰富的个人和企业积累知识、数据,用这些「喂饱」AI 助理,为发挥能力打下基础;二是一触即达的能力,AI 助理仅通过对话窗口让个人、企业快捷地直达各类工具和应用,满足客户明确需求。


对比之下,依托底层大模型的 AI Agent 无法做到这样上连应用场景,下连业务数据,它们与钉钉 AI 助理的最核心差异也在于此。


打造 AI 助理集散地,人人都能靠创意获益


除了将 AI 助理打造得更强大、更全面、更友好,钉钉想的更远。


钉钉认为,AI 助理将成为未来应用和人机交互的主流形态,蕴藏着丰富的价值交互模式,因此推出 AI 助理市场,将官方 Al 助理、生态伙伴和开发者构建的 Al 助理、个体用户创建的 Al 助理都纳入其中。


此举意在以自身为阵地,聚集各方智慧,形成合力,激发 AI Agent 领域的创新活力,打造 AIGC 时代最活跃的 AI 助理孵化、分发和交易平台。同时钉钉 AI 助理 + 创建 +AI 助理市场的设计链路集中供给侧创建者的创造力和需求侧客户的多样化需求,这要比需求侧没有需求的 GPTs 更有应用前景。


上手体验:创建便捷度拉满,人人皆可 AI


机器之心第一时间上手进行了体验。下图为 AI 助理创建界面,包含角色设定、知识学习、能力学习、语气风格设置等组件。



我们首先创建一个「论文大师」,各项配置如下。这里让它学习了 transformer 论文《Attention is all you need》。



关于这篇论文的一切问题,「论文大师」都可以应答自如。你可以在知识学习中添加更多相关文档,这样它会回答得更全更细。



接着创建了一个「封面生成器」



生成的封面可以直接拿来用。



最后创建了一个「请假直通车」



请假申请、发起审批、抄送人事、同步日历,一气呵成。



体验下来的最大感受是对普通用户极其友好,点击、选择、上传即可,各项配置都有相应示例,创建起来轻松、便捷。可以说,钉钉 AI 助理极大降低了使用门槛,让人人皆可 AI 成为可能,加速 AI「渗透」日常生活、工作和广泛业务场景的速度,为 AI 普惠带来积极影响。


相较于 GPTs,钉钉 AI 助理被赋予的能力更多样,除了文本和图像等基础 AIGC 能力,其他更多能力与打工人生活、工作息息相关。再加上为开发者开放的自定义权限,让能力得到极大延展。



OpenAI GPTs 配置界面。


很显然,钉钉 AI 助理是更适合打工人体质的 AI Agent。


用 AI 助理重造钉钉,走出智能化关键一步


大模型发展至今,学界、业界和科技领袖们逐渐形成共识 —— 大模型的机会在应用层。应用层的创新对 AIGC「向下走」很重要,让人轻松上手这点尤为关键。


AI 助理正是钉钉给出的新解法,将以往点菜单找入口的交互方式演变为纯粹的自然语言沟通,凭借跨应用执行能力成为调用所有 AI 应用的首选入口,一对多解决各类需求。而钉钉要成为高频和开放的 AI 智能助理平台,通过开放、低门槛的 AI 助理,将自身改造成为超级应用。


从更大视角来看,作为 2023 年 11 月钉钉成为阿里首批战略级创新业务「四小龙」之后的首次重磅发布,AI 助理势必成为钉钉全面智能化进程中的里程碑式产品。


自 2023 年初以来,钉钉全面智能化便如火如荼展开,4 月接入通义千问大模型并展示「/」魔法棒, 8 月 17 条产品线、55 个场景全面接入大模型、面向生态伙伴和客户开放智能化底座(AI PaaS),11 月正式上线钉钉 AI 魔法棒,几天前正式全量上线钉钉个人版。


不到一年,无论是 AI 产品、应用,还是生态,钉钉一样都没落下。此次 AI 助理更进一步,为钉钉 All in 智能化添砖加瓦,助力走得更远、更深、更广。


对于参与到钉钉全面智能化进程中的个人和企业,他们也将享受到 AI + 带来的红利。


一方面,AI 助理连同钉钉个人版使个体体验全面升级,每个人都能借助智能化生产力和创作工具,提升工作效率,拓宽认知、创造力边界。


另一方面,AI 助理有助于推动行业智能化普惠。过去钉钉先后推动了中国企业的移动办公普惠、数字化普惠,而今面向大模型时代,钉钉用「/」魔法棒、数字员工、AI 助理持续发力,降低中小企业使用 AI 的门槛,加速智能化落地实践。


我们有理由期待,几个月后,不只有单一大模型的 AI Agent,更多的「钉钉 AI 助理」走出来,给 AI 的演进带来不同的实现路径,这才是先进技术应有的演进方向。


参考链接:

https://www.gatesnotes.com/AI-agents

https://lilianweng.github.io/posts/2023-06-23-agent/


文章来自于微信公众号 “机器之心”,作者 “杜伟


关键词: AI Agent , GPTs , AIGC , 钉钉AI助理
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

2
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT

3
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI

4
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner

5
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0