ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
AI的颠覆性到底在哪里?
8579点击    2024-03-11 10:57


AI的颠覆性到底在哪里?就仅止于内容生成么?如果我们现在已经被各种应用充斥的生活会因为它而改变,到底会改变成什么样子?


一直想找到一个形象又精准的描述,但并没找到。像总说的Agent太含糊了,图灵测试2.0和智能原生更像是起点和终点,中间则缺了点什么。


最后就自己杜撰了一个:角色中心式计算(Role-Centered Computing,RCC)。这个词可以用来透视大模型在应用上的颠覆性。


因为这不是个技术文章,所以我们不往精准严密努力,而是尽可能让它更加的通俗易懂一些。如果真相信AGI会实现,并想以AGI的实现为前提来思考和窥视应用的变化,角色中心式计算这个概念大概率是绕不过去的。


一、以功能为中心式计算


我们很多人每天都在用的微信、抖音,其背后隐含的分工模式和结构特征在最近这二十几年并没有太大变化。虽然也加了很多的算法比如推荐、人脸、语音识别等,但本质上几乎所有的应用都是以功能为中心进行构建的,比如:娱乐、电商、IM、打车、外卖等。不同的“功能”商业价值大小不同,最终导致这些产品所对应的公司市值不同。


每个竞争胜出的公司会占据对应的功能节点,在实现对应产品上自己构建用户体系,然后尽可能针对不同的用户提供基于偏好的定制(个性化推荐等)。这有点像什么呢?有点像工厂,它把人的需求切成不同的条块,然后力所能及的做点定制,你做毛巾,它做洗发液,最终凑在一起完成一个洗浴的过程。


这时候从单个功能的角度看产品是完整的,从人的角度看,使用这些功能的人其实是被切片的,算法改善的最多就是切片的形状。在企业里这种切片是这样的:


切片示意图


为什么会这样呢?


智能的供给度导致只能这样。


按角色来设计产品会导致太多的变动,投入巨大,体验下降,创造的价值却被摊薄。功能或者需求不明确,在过去程序员就没法把想法对应到代码,并实现出体验良好的产品来,只能做出智能音箱、Siri这样似是而非的产品来。什么都能干,但什么都干不好。


但这种现实和AGI显然是冲突的,AGI的通用性为什么会被切片所局限呢?


AGI的智能如果没有边界,那就必然会对切片进行整合,重新构建使用场景和体验。


这会带来什么变化呢?


这会让以功能为中心的计算加速向以角色为中心的计算进行过渡。


二、从以功能为中心到以角色为中心


什么是以角色为中心计算呢?


我们举两个例子。


比如一个人的生活,它日常就有衣食住行玩。以角色为中心就是他不知道应用怎么分类的,但可以无缝的从这些服务中切换。


它不需要知道发消息要找一个叫微信的产品,看视频或者直播需要找一个叫抖音的产品,或者读书还要找个起点的APP,出行要找X,打车要找Y,家里玻璃坏了要找Z。


到工作场所则要启动公司的各种应用可能是钉钉或者什么,查看邮箱,启动Office等等。


如果抛开习以为常的视角,不觉得就应该这样,而是贴着使用者最为便利体验最佳的角度进行思考,那组合就会变成:


张三有一个生活场景的应用,一个工作角色的应用,每一个的背后可能是过去的XYZ或者ABC;


李四也有这两种应用,背后的组合却不同,可以是XYA,ABD等等。


这种按角色和场景灵活组合和调度功能的方式,如果实现了,那么计算形态就是以角色为中心的计算。


因为是面向未来的概念,我们再举个例子,比如一个公司里面负责招聘的人,现在他为了完成招聘需要使用大量的工具比如:沟通工具收集需求,内部的ERP完成付款等,内部的流程工具管控招聘流程,外部的某招聘网站对接好筛选简历,微信以至于会议软件和面试官、候选人邀约并面试等。


在现在的状况下,他是被按功能切割出来的各种应用所包围的,自己是那个Hub,负责把这些东西串起来,然后像小牛一样拉着这些产品往前跑。实际上差不多就是每个人配了一套要你命。


以角色为中心计算示意图


以角色为中心计算下就不是这样,这些功能组件(比如沟通的工具等)还是要的,但需要屏蔽在招聘这个角色后面进行重新组合。人需要的是确立行为原则,然后特定的时候对执行结果进行召回,一个类似个人角色的Agent要完成各种基础工作,并把结果报告给对应的负责的人。那个角色变成了Agent。(Agent负责调度ERP、招聘网站等。)


三、原动力


为什么不是现在这样挺好,而是要再整合呢?


高维视角上的回答是应用形态会贴着体验更好,效率更高走,而不是相反。


显然以角色为中心的计算在两方面都有优势。


这个最直观的体会反倒是李雪琴段子里说的:大数据好像是跨应用的。但实际上完整的应用完整的信息确实能提供更好的体验。


更现场的角度则是效率的原因,钢铁侠里的Jarvis有没有显然影响战斗力,而Jarvis确实也很难说:我就负责飞,不负责打架。


四、为什么角色中心式计算是本质性问题?


既然原来的功能也还在,那么为什么计算模式的改变是本质性变化呢?


因为核心特征变了。


当现在的每个产品变成单纯的功能模块,产品含义无疑就发生变化。


这时候需要关注的是角色本身的定义,而非功能的定义。


比如你突然坐到直升机上了,然后不会开直升机,这时候要加载的是直升机驾驶员的角色,而不是,驾驶员的打散大礼包。


这会导致现有的应用被折叠。再危言耸听一点就是现在的各种应用会管道化,如果不是新应用的成功者,那现有公司的价值会大幅打折。


就好比我们聊天说某个人的时候,除了生病的时候不会关注他心率、血压等(功能层面),而更关注人的性情,行事的风格(角色层面)


五、核心依赖


这种趋势的确定性是非常强的,核心就依赖三个要素:


AGI越来越近,并且最终实现。


C端对体验的追求,B端对效率的追求确定。


那计算的模式就会从功能中心式计算切换为角色中心式计算。


这里面最不确定的其实是AGI,没有AGI实现不了以角色为中心式计算。


从这个视角下更能清楚看到已经出现的各种产品的定位:模型、各种模型外围的工具包括MJ等其实是以角色为中心式计算的素材,是基座但不是核心,所有这些工具形成下图中的3。


(如果上面的描述还是不好理解,其实可以打打大型的RPG游戏,这种游戏天生以角色为中心,那个游戏里面还是以某个垂直功能比如电商为中心的。)


六、递进次序与愿景


新东西成立的时候总是在一个固有模式没那么顽固的地儿先生根发芽。然后当茁壮成长了再经历一个从非主流翻转到主流的过程。


在纯粹的C端,这种模式催生出的智能原生应用很难颠覆既有格局。


所有的智能助手包括智能音箱的方向其实就是以角色为中心的方向,方向不是不对,但很难成立,因为既有力量过于强大了。你是现有的APP,你愿意被遮掉变成背后的模块么?


所以如果是C端的视角以角色为中心式计算在游戏上确实会大规模应用,然后也许会过渡到专门的硬件产品,在既有通用计算平台(比如手机)上反倒是难实现。


在B端则是不一样的故事,B端的场景在公司内部,角色的重新整合相对会容易一些。但既有的流程、工具结合体会成为障碍,所以估计也只能是现在某些中小且灵活轻量的地儿进行尝试。


如果把这个思考方法提炼下,那么如果是基于技术本身思考就需要考虑,幻觉有害度;如果从外往里思考就需要考虑那里固有的势力没那么顽固。最终的目标都是完成从以功能为中心的计算到以角色为中心的计算的跃迁。


有的时候我看咨询界同仁用下一代ERP来描述未来企业级应用。


这其实是说明还没想清楚,当我们用新、下一代这类词的时候很可能看到的就是一个模糊的轮廓但需要描述,否则还是应该描述特征。什么叫下一代呢。


七、这是新机会么?


这肯定是新的机会,但非常繁琐。


整个产品的方法论需要与此适配,互联网思维是有害的。


之前曾经多次类比,智能原生应用的打磨会很像一个打井的过程,你打出多少水就能喝多少,但很难一下子出很多水。


而过程中并不是有砖头(大模型等)就行,你还要确定你的环境(领域模型),比如到底有没有水,有没有巨石拦路等等。


这是一个大综合的过程。


一定程度上如果智能的使用成本逐步降低,那其实了解你的场景比了解模型更重要。但确实需要锐意进取跟进模型进展。


琢磨事这个号里面一共有三个连续的概念与此相关:


一个是图灵测试2.0,这相当于选定哪里能打出水来。(《为什么说AI现在还不行?》)


一个是上面说的角色中心式计算。这相当于说打井的时候不要用老式的方法了,要开始以智能更充沛为前提进行思考。


一个是智能原生应用。这个更近一步,相当于是实现角色中心式计算所要遵循的原则和应用潜在的结构。(《智能原生:AI蓝海世界的关键钥匙》)


有点递进的意思。未必很准确,但很多时候需要这个视角。


视角对思考结果的影响可能比过程还大。比如:


如果我们单纯看大模型,那其实这是个商业上让人很绝望的领域,必须靠信念才能继续。


如果我们单纯看大模型的工具应用,那就会发现它们都很小,差不多是给大模型在查缺补漏。有点Windows附件的感觉,从投资角度就不怎么值得尝试。


但从上述视角上就比较容易能看到AI背后的波澜壮阔。


前几天看到某知名投资人又论了一下AI。


不是不对,大部分还是和之前文章中提到的比较吻合的,但核心问题就是视角还是从既有场景逐步优化的角度来看AI,这时候都已经塞得满满的现实哪有AI的位置呢?


所以估计也看不出什么来,很可能实际是悲观的。


视角会遮蔽相当多的东西。


八、小结


当年做智能音箱的时候,其实就隐约有这种感觉,和最近在打磨的产品一验证,现在就更确定从计算模式的角度来看待AI,更能看到在整个大IT发展脉络上它所会扮演的角色,看到变量和增量。可以不同意上面说的,那至少要想想AGI下,计算的模式会变成什么样子呢?然后应用会是什么样子?


在我的理解里:最终人的代理和数字世界的代理会合二为一,最终你就只有一个应用,它扮演数字和物理世界的接口,不同的情况下它需要装载不同的角色。


文章来自于微信公众号:琢磨事(ID:zuomoshi),作者 “老李话一三


关键词: AI , AIGC , 人工智能
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

2
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales