对于「通用人工智能」,OpenAI科学家Karpathy下场做出了解释。
前几天,Karpathy在个人blog发表了一篇文章「将自动驾驶作为AGI的一个案例来研究」。
不知是何原因,他却删除了这篇文章,幸而,还有网络备份。
众所周知,Karpathy不仅是OpenAI 的创始成员之一,还曾是特斯拉前AI高级总监、自动驾驶Autopilot负责人。
他将自动驾驶作为案例,研究AGI,这篇文章的观点确实值得一看。
自动驾驶
LLM的爆发引发了众多关于AGI降临的时间,甚至它可能是什么样子的讨论。
有的人对AGI未来充满希望,持有乐观的态度。而有的人却充满恐惧和悲观的情绪。
不幸的是,其中也有很多讨论过于抽象,导致人们的观点互不接轨。
因此,我总是在寻找具体的类比和历史先例,用更具体的术语来探讨这个主题。
特别是,当我被问及「你认为AGI会是什么样子」时,我个人喜欢用自动驾驶举例。在这篇文章中,我想解释一下原因。让我们从AGI的一个常见定义开始:
AGI:一个在大多数有经济价值的工作中超越人类能力的自主系统。
请注意,在这个AGI定义中有两个具体要求。
首先,它是一个完全自主的系统,即自己运作,很少或根本没有人类监督。
其次,它在大多数有经济价值的工作上都是自主运作的。关于这部分数据,我个人喜欢参考美国劳工统计局的职业指数。
一个同时具有这两种性质的系统,我们将其称之为AGI。
我想在这篇文章中建议的是,最近我们自动驾驶能力的发展是一个非常好的早期案例,研究了日益自动化的社会动态,可以拓展到对AGI的总体样貌和感受的研究。
我这样认为的原因是,这个领域具有几个特征。可以简单地说「it is a big deal」:自动驾驶对社会来说非常容易理解,更常见。
它在经济规模上占据了很大一部分,并且雇佣了大量的人类劳动力。驾驶是一个足够复杂的问题,但我们已经实现自动化,并引来社会的高度关注。
当然,也还有其他的行业实现了大规模的自动化,但要么是我个人对它们不太熟悉,要么它们在上述一些属性方面有所欠缺。
驾驶的自动化被认为是AI领域中一个极具挑战的问题,并非一蹴而就。
它是通过逐步将驾驶任务自动化的过程而成的,这个过程中涉及了许多阶段性的「工具型AI」。
在车辆自动化方面,目前许多汽车已经配备了L2级驾驶辅助系统。即一个能与人类司机协作,共同完成从起点到终点旅程的AI。
虽然它还不能完全自主驾驶,但L2已经能处理许多驾驶中的基础任务。
有时,它甚至能自动完成整个操作流程,比如自动泊车。
在这一过程中,人类主要扮演监督角色,甚至可以随时接手,直接驾驶或下达高级指令(如换道请求)。
在某些方面(比如保持车道居中和快速决策),AI的表现甚至超过了人类,但在一些罕见的情况下还是会有所不足。
这与我们在其他行业看到的许多AI工具非常相似,特别是随LLM最近的技术突破。
例如,作为程序员,当我用GitHub Copilot来自动补全一段代码,或使用GPT-4编写更复杂的函数时,我实际上是将基础任务交给了自动化系统.
但同样,如有需要,我也可以随时介入进行调整。
换句话说,Copilot和GPT-4就像是在编程领域的「二级」自动化工具。
在整个行业中,有许多类似的「二级」自动化解决方案,但并不是所有的都基于大模型,从TurboTax,到亚马逊仓库中机器人,再到翻译、写作、艺术、法律、营销等领域的各种「工具型 AI」。
全自动驾驶
随着时间的推移,一些系统的可靠性达到了新高度,变得就像今天的Waymo那样。
它们正逐步实现「全自动驾驶」。
如今,在旧金山,你只需打开应用,就能叫到一辆Waymo无人驾驶车,它将会来接你,并把你安全送达目的地。
这实在是令人惊叹。你无需懂得驾驶,也无需关注路况,只需舒服地靠后坐,并小憩片刻,系统便会将你从起点带到终点。
与我交谈过的许多人一样,我个人更倾向于选择Waymo而非Uber,我几乎只使用它来进行市内交通。
你会拥有更稳定、可预测的旅程体验,而且驾驶过程平稳,可以听音乐,不用顾及司机在听你说话时在想什么。
虽然自动驾驶技术已经走入现实,但仍有许多人选择使用Uber。原因何在?
首先,很多人根本不知道他们可以选择Waymo作为出行工具。即便知道,许多人对自动化系统仍缺乏足够的信任,更倾向于由人类司机驾驶。
不过,即使有些人接受自动驾驶,或许他们还是更倾向于人类司机,比如享受与司机的交谈,以及与他人的互动。
不仅仅是个人偏好,从现在应用中不断增长的等待时间可以看出,Waymo面临着供不应求的问题。市场上的车辆数量远远无法满足需求。
这部分原因可能是,Waymo在管理和监测风险和舆论方面非常谨慎。
另一方面,据我所知,Waymo受到监管机构的限制,只能在街道上部署一定数量的车辆。另一个限制因素是,Waymo不能一夜之间就完全取代Uber。
他们需要建立基础设施,生产汽车,扩大运营规模。
我个人认为,其他经济领域的自动化也将面临同样的情况——有些人/公司会立即采用它们,但许多人(1)不了解这些技术,(2)即便了解,也不会信任它们,(3)即使信任,他们仍然更愿意与人类合作。
但除此之外,需求超过供应,AGI也将因为同样的原因受到同样的限制,包括开发商的自我约束、监管限制以及资源短缺,比如需要建立更多的GPU数据中心。
正如我已经在资源限制中暗示的那样,这种技术的全球化部署成本非常高,还需要耗费大量人力,推广速度也慢。
今天,Waymo只能在旧金山和凤凰城驾驶,但这种技术本身是通用的,还可以扩展,因此该公司可能很快就会推广到洛杉矶、奥斯汀等地。
自动驾驶汽车还可能会受到其他环境因素的限制,比如在大雪中驾驶。在一些罕见的情况下,它甚至可能需要操作员的救援。
此外,技术能力的扩展还需要很多资源成本,并非是免费的。
比如,Waymo必须投入资源后才能进入另一个城市,比如绘制街道地图、整体感知路径规划、控制算法以适应某些特殊情况,或当地的法规。
就像我们的工作比喻所示,许多工作可能只在某些特定环境下才能实现自动化,若是扩大范围还需要大量的工作。
无论哪种情况,自动驾驶技术本身都是通用的和可扩展的,其应用前景将随着时间的推移而逐步拓宽。
关于自动驾驶技术逐渐融入社会的过程,我觉得特别有趣的一点是——
就在几年前,人们还在热烈讨论并对其充满了疑虑和担忧,争论着它是否能够成功运作,甚至是否可行,这成了一个广泛关注的议题。而现在,自动驾驶不再是未来的梦想,它真的出现了。
它不仅仅是一个研究原型,而是成为了一种可以用金钱购买的完全自动化交通方式。
在目前的应用范围内,自动驾驶技术已经实现了完全的自主性。
然而,总体来看,这似乎并没有引起太多人的关注。我交流过的大多数人(包括科技领域的!)甚至都不知道这一进展。
当你乘坐Waymo在旧金山的街道上行驶时,你会发现很多人对它投以好奇的目光。他们首先会感到惊讶,然后好奇地凝视。
之后,他们就会继续自己的生活。
当自动驾驶技术在其他行业也实现完全自主时,世界可能并不会因此而动荡不安。
大多数人可能一开始,甚至都没意识到这一变化。当他们注意到时,可能只是好奇地看一眼,然后不以为意,这种反应从否认到接受都有。
有些人可能会因此感到不安,甚至采取一些抗议行动,比如向Waymo汽车前放置交通锥这样的举动。
当然,到目前为止,我们距离见证这一现象完全上演还很遥远。但当它发生时,我期望它在很大程度上具有预测性。
当我们讨论就业时,不可否认,Waymo明显地取代了驾驶员的岗位。
但同时,它也催生了许多以前不存在的工作岗位,这些岗位相对不那么显眼——比如为神经网络收集训练数据的标注人员、远程协助遇到问题汽车的客服人员、负责建造和维护车队的工作人员等等。
首先诞生的是一个包含各种传感器和相关基础设施的全新行业,旨在构建这些装备精密的高科技汽车。
正如人们对工作的普遍看法一样,许多岗位都将发生改变,一些岗位会因此消失,但也会出现很多新的岗位。
这其实是工作形态的一种转变,而非简单的岗位减少,尽管岗位减少是最直观的变化。
虽然很难说总体就业人数不会随着时间推移而减少,但这种变化的速度比人们简单预想的要慢得多。
最后,我想谈谈自动驾驶领域的竞争环境。
几年前,自动驾驶汽车公司如雨后春笋般涌现。但今天,随着人们逐渐意识到这项技术的复杂性(我个人认为,基于当前的人工智能和计算技术,实现自动化仍然十分困难),这个领域已经经历了大规模的整合。
其中,Waymo成为了首个完整展示自动驾驶未来的公司。
尽管如此,还有一些公司仍在紧追不舍,比如Cruise、Zoox,以及我个人特别喜欢的Tesla。
这里我要简单提一下,基于我在这个领域的经历和参与。在我看来,自动驾驶行业的终极目标是实现全球范围内的完全自动驾驶。
Waymo选择了先实现自动驾驶再全球扩展的策略,而Tesla则是先全球布局再逐步提升自动驾驶技术。
显然,这两家公司将会面临截然不同的调整:一家主要是软件方面的工作,另一家则是硬件方面的工作。
目前,我对他们的产品都非常满意,个人而言,我更是对技术本身充满了支持。
同样的,很多其他行业也可能经历一个快速增长和扩张的阶段(就像大约在2015年的自动驾驶领域),但最终,可能只有少数几家公司在这场竞争中存活下来。
在这个过程中,将会有许多实用的AI辅助工具(比如现在的L2 ADAS功能)和一些开放平台(比如Comma)得到广泛应用。
以上就是我对通用人工智能(AGI)未来发展的大致设想。
想象一下,这样的变革将以不同的速度遍布整个经济体,并伴随着许多难以预料的相互影响及连锁反应。
虽然这个设想可能不尽完美,但我认为它是一个值得记住并有益参考的模型。
从模因(memetic)的角度来看,AGI与那种逃离我们控制、在网络空间自我递归提升、制造致命病原体或纳米机器人、最终把银河系变为灰色粘质的超级智能相去甚远。
相比之下,它更像是自动驾驶技术的发展——一项正在快速推进且能改变社会的自动化技术。其发展速度会在包括受教育的劳动力资源、信息、材料、能源,以及监管等多个方面受到限制。
在这之中,社会既是观察者也是参与者。
世界不会因此崩溃,而是会适应、变化并重新构建。
就自动驾驶本身而言,交通自动化将大大提升安全性,城市将变得更加清新、通畅,而那些占据道路两旁的停车场和停放的汽车将逐渐消失,从而让出更多的空间。
对于通用人工智能(AGI)带来的所有这些可能的变革,我个人是充满期待的。
总而言之,Karpathy将AGI看作更像是自动驾驶的发展,这一具体类比的观点,引发了众多网友的讨论。
「看到那个无法交付FSD的人,决定将FSD与AGI进行类比,实际上确实给了我信心,我们还有几十年的时间」。
是啊,他好像忘记了「G」。我记得Norvig在几十年前的人工智能著作中曾说过,「智能」并不意味着无所不能,一个智能体要想有用,解决一个小问题就足够了。在我看来,这就是G的由来。
而我们现在却突然又回到了以前那个狭隘的定义?我仍然看不到从LLM和自动驾驶到AGI的路径。
当然,AGI 的发展可能是渐进而缓慢的,就像我们看到Waymo打造自动驾驶汽车一样。但这只是众多方式中的一种,你也可以看到AGI通过非常不同的方式突然出现,就像通过扩展大规模LLM那样。
参考资料:
https://web.archive.org/web/20240122062223/https://karpathy.github.io/2024/01/21/selfdriving-agi/
文章来自于微信公众号 “新智元”
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md