OpenAI联创Karpathy发文：用自动驾驶诠释AGI！原贴已删速收藏

7213点击 2024-01-27 13:41

你认为的AGI是什么样子的？OpenAI联创、前特斯拉AI总监Karpathy发文，用自动驾驶诠释AGI！

对于「通用人工智能」，OpenAI科学家Karpathy下场做出了解释。

前几天，Karpathy在个人blog发表了一篇文章「将自动驾驶作为AGI的一个案例来研究」。

不知是何原因，他却删除了这篇文章，幸而，还有网络备份。

OpenAI联创Karpathy发文：用自动驾驶诠释AGI！原贴已删速收藏

众所周知，Karpathy不仅是OpenAI 的创始成员之一，还曾是特斯拉前AI高级总监、自动驾驶Autopilot负责人。

他将自动驾驶作为案例，研究AGI，这篇文章的观点确实值得一看。

OpenAI联创Karpathy发文：用自动驾驶诠释AGI！原贴已删速收藏

自动驾驶

LLM的爆发引发了众多关于AGI降临的时间，甚至它可能是什么样子的讨论。

有的人对AGI未来充满希望，持有乐观的态度。而有的人却充满恐惧和悲观的情绪。

不幸的是，其中也有很多讨论过于抽象，导致人们的观点互不接轨。

因此，我总是在寻找具体的类比和历史先例，用更具体的术语来探讨这个主题。

特别是，当我被问及「你认为AGI会是什么样子」时，我个人喜欢用自动驾驶举例。在这篇文章中，我想解释一下原因。让我们从AGI的一个常见定义开始：

AGI：一个在大多数有经济价值的工作中超越人类能力的自主系统。

OpenAI联创Karpathy发文：用自动驾驶诠释AGI！原贴已删速收藏

请注意，在这个AGI定义中有两个具体要求。

首先，它是一个完全自主的系统，即自己运作，很少或根本没有人类监督。

其次，它在大多数有经济价值的工作上都是自主运作的。关于这部分数据，我个人喜欢参考美国劳工统计局的职业指数。

一个同时具有这两种性质的系统，我们将其称之为AGI。

OpenAI联创Karpathy发文：用自动驾驶诠释AGI！原贴已删速收藏

我想在这篇文章中建议的是，最近我们自动驾驶能力的发展是一个非常好的早期案例，研究了日益自动化的社会动态，可以拓展到对AGI的总体样貌和感受的研究。

我这样认为的原因是，这个领域具有几个特征。可以简单地说「it is a big deal」：自动驾驶对社会来说非常容易理解，更常见。

它在经济规模上占据了很大一部分，并且雇佣了大量的人类劳动力。驾驶是一个足够复杂的问题，但我们已经实现自动化，并引来社会的高度关注。

当然，也还有其他的行业实现了大规模的自动化，但要么是我个人对它们不太熟悉，要么它们在上述一些属性方面有所欠缺。

L2级自动化

驾驶的自动化被认为是AI领域中一个极具挑战的问题，并非一蹴而就。

它是通过逐步将驾驶任务自动化的过程而成的，这个过程中涉及了许多阶段性的「工具型AI」。

在车辆自动化方面，目前许多汽车已经配备了L2级驾驶辅助系统。即一个能与人类司机协作，共同完成从起点到终点旅程的AI。

虽然它还不能完全自主驾驶，但L2已经能处理许多驾驶中的基础任务。

有时，它甚至能自动完成整个操作流程，比如自动泊车。

OpenAI联创Karpathy发文：用自动驾驶诠释AGI！原贴已删速收藏

在这一过程中，人类主要扮演监督角色，甚至可以随时接手，直接驾驶或下达高级指令（如换道请求）。

在某些方面（比如保持车道居中和快速决策），AI的表现甚至超过了人类，但在一些罕见的情况下还是会有所不足。

这与我们在其他行业看到的许多AI工具非常相似，特别是随LLM最近的技术突破。

例如，作为程序员，当我用GitHub Copilot来自动补全一段代码，或使用GPT-4编写更复杂的函数时，我实际上是将基础任务交给了自动化系统.

但同样，如有需要，我也可以随时介入进行调整。

换句话说，Copilot和GPT-4就像是在编程领域的「二级」自动化工具。

在整个行业中，有许多类似的「二级」自动化解决方案，但并不是所有的都基于大模型，从TurboTax，到亚马逊仓库中机器人，再到翻译、写作、艺术、法律、营销等领域的各种「工具型 AI」。

OpenAI联创Karpathy发文：用自动驾驶诠释AGI！原贴已删速收藏

全自动驾驶

随着时间的推移，一些系统的可靠性达到了新高度，变得就像今天的Waymo那样。

它们正逐步实现「全自动驾驶」。

如今，在旧金山，你只需打开应用，就能叫到一辆Waymo无人驾驶车，它将会来接你，并把你安全送达目的地。

这实在是令人惊叹。你无需懂得驾驶，也无需关注路况，只需舒服地靠后坐，并小憩片刻，系统便会将你从起点带到终点。

与我交谈过的许多人一样，我个人更倾向于选择Waymo而非Uber，我几乎只使用它来进行市内交通。

你会拥有更稳定、可预测的旅程体验，而且驾驶过程平稳，可以听音乐，不用顾及司机在听你说话时在想什么。

OpenAI联创Karpathy发文：用自动驾驶诠释AGI！原贴已删速收藏

「复合经济」

虽然自动驾驶技术已经走入现实，但仍有许多人选择使用Uber。原因何在？

首先，很多人根本不知道他们可以选择Waymo作为出行工具。即便知道，许多人对自动化系统仍缺乏足够的信任，更倾向于由人类司机驾驶。

不过，即使有些人接受自动驾驶，或许他们还是更倾向于人类司机，比如享受与司机的交谈，以及与他人的互动。

不仅仅是个人偏好，从现在应用中不断增长的等待时间可以看出，Waymo面临着供不应求的问题。市场上的车辆数量远远无法满足需求。

这部分原因可能是，Waymo在管理和监测风险和舆论方面非常谨慎。

另一方面，据我所知，Waymo受到监管机构的限制，只能在街道上部署一定数量的车辆。另一个限制因素是，Waymo不能一夜之间就完全取代Uber。

他们需要建立基础设施，生产汽车，扩大运营规模。

我个人认为，其他经济领域的自动化也将面临同样的情况——有些人/公司会立即采用它们，但许多人（1）不了解这些技术，（2）即便了解，也不会信任它们，（3）即使信任，他们仍然更愿意与人类合作。

但除此之外，需求超过供应，AGI也将因为同样的原因受到同样的限制，包括开发商的自我约束、监管限制以及资源短缺，比如需要建立更多的GPU数据中心。

技术全球化

正如我已经在资源限制中暗示的那样，这种技术的全球化部署成本非常高，还需要耗费大量人力，推广速度也慢。

今天，Waymo只能在旧金山和凤凰城驾驶，但这种技术本身是通用的，还可以扩展，因此该公司可能很快就会推广到洛杉矶、奥斯汀等地。

自动驾驶汽车还可能会受到其他环境因素的限制，比如在大雪中驾驶。在一些罕见的情况下，它甚至可能需要操作员的救援。

OpenAI联创Karpathy发文：用自动驾驶诠释AGI！原贴已删速收藏

此外，技术能力的扩展还需要很多资源成本，并非是免费的。

比如，Waymo必须投入资源后才能进入另一个城市，比如绘制街道地图、整体感知路径规划、控制算法以适应某些特殊情况，或当地的法规。

就像我们的工作比喻所示，许多工作可能只在某些特定环境下才能实现自动化，若是扩大范围还需要大量的工作。

无论哪种情况，自动驾驶技术本身都是通用的和可扩展的，其应用前景将随着时间的推移而逐步拓宽。

社会反应：很快成为「过眼云烟」

关于自动驾驶技术逐渐融入社会的过程，我觉得特别有趣的一点是——

就在几年前，人们还在热烈讨论并对其充满了疑虑和担忧，争论着它是否能够成功运作，甚至是否可行，这成了一个广泛关注的议题。而现在，自动驾驶不再是未来的梦想，它真的出现了。

它不仅仅是一个研究原型，而是成为了一种可以用金钱购买的完全自动化交通方式。

在目前的应用范围内，自动驾驶技术已经实现了完全的自主性。

然而，总体来看，这似乎并没有引起太多人的关注。我交流过的大多数人（包括科技领域的！）甚至都不知道这一进展。

当你乘坐Waymo在旧金山的街道上行驶时，你会发现很多人对它投以好奇的目光。他们首先会感到惊讶，然后好奇地凝视。

之后，他们就会继续自己的生活。

当自动驾驶技术在其他行业也实现完全自主时，世界可能并不会因此而动荡不安。

OpenAI联创Karpathy发文：用自动驾驶诠释AGI！原贴已删速收藏

大多数人可能一开始，甚至都没意识到这一变化。当他们注意到时，可能只是好奇地看一眼，然后不以为意，这种反应从否认到接受都有。

有些人可能会因此感到不安，甚至采取一些抗议行动，比如向Waymo汽车前放置交通锥这样的举动。

当然，到目前为止，我们距离见证这一现象完全上演还很遥远。但当它发生时，我期望它在很大程度上具有预测性。

经济影响

当我们讨论就业时，不可否认，Waymo明显地取代了驾驶员的岗位。

但同时，它也催生了许多以前不存在的工作岗位，这些岗位相对不那么显眼——比如为神经网络收集训练数据的标注人员、远程协助遇到问题汽车的客服人员、负责建造和维护车队的工作人员等等。

首先诞生的是一个包含各种传感器和相关基础设施的全新行业，旨在构建这些装备精密的高科技汽车。

正如人们对工作的普遍看法一样，许多岗位都将发生改变，一些岗位会因此消失，但也会出现很多新的岗位。

这其实是工作形态的一种转变，而非简单的岗位减少，尽管岗位减少是最直观的变化。

虽然很难说总体就业人数不会随着时间推移而减少，但这种变化的速度比人们简单预想的要慢得多。

竞争环境

最后，我想谈谈自动驾驶领域的竞争环境。

几年前，自动驾驶汽车公司如雨后春笋般涌现。但今天，随着人们逐渐意识到这项技术的复杂性（我个人认为，基于当前的人工智能和计算技术，实现自动化仍然十分困难），这个领域已经经历了大规模的整合。

其中，Waymo成为了首个完整展示自动驾驶未来的公司。

尽管如此，还有一些公司仍在紧追不舍，比如Cruise、Zoox，以及我个人特别喜欢的Tesla。

OpenAI联创Karpathy发文：用自动驾驶诠释AGI！原贴已删速收藏

这里我要简单提一下，基于我在这个领域的经历和参与。在我看来，自动驾驶行业的终极目标是实现全球范围内的完全自动驾驶。

Waymo选择了先实现自动驾驶再全球扩展的策略，而Tesla则是先全球布局再逐步提升自动驾驶技术。

显然，这两家公司将会面临截然不同的调整：一家主要是软件方面的工作，另一家则是硬件方面的工作。

目前，我对他们的产品都非常满意，个人而言，我更是对技术本身充满了支持。

OpenAI联创Karpathy发文：用自动驾驶诠释AGI！原贴已删速收藏

同样的，很多其他行业也可能经历一个快速增长和扩张的阶段（就像大约在2015年的自动驾驶领域），但最终，可能只有少数几家公司在这场竞争中存活下来。

在这个过程中，将会有许多实用的AI辅助工具（比如现在的L2 ADAS功能）和一些开放平台（比如Comma）得到广泛应用。

OpenAI联创Karpathy发文：用自动驾驶诠释AGI！原贴已删速收藏

通用人工智能（AGI）

以上就是我对通用人工智能（AGI）未来发展的大致设想。

想象一下，这样的变革将以不同的速度遍布整个经济体，并伴随着许多难以预料的相互影响及连锁反应。

虽然这个设想可能不尽完美，但我认为它是一个值得记住并有益参考的模型。

从模因（memetic）的角度来看，AGI与那种逃离我们控制、在网络空间自我递归提升、制造致命病原体或纳米机器人、最终把银河系变为灰色粘质的超级智能相去甚远。

OpenAI联创Karpathy发文：用自动驾驶诠释AGI！原贴已删速收藏

相比之下，它更像是自动驾驶技术的发展——一项正在快速推进且能改变社会的自动化技术。其发展速度会在包括受教育的劳动力资源、信息、材料、能源，以及监管等多个方面受到限制。

在这之中，社会既是观察者也是参与者。

世界不会因此崩溃，而是会适应、变化并重新构建。

就自动驾驶本身而言，交通自动化将大大提升安全性，城市将变得更加清新、通畅，而那些占据道路两旁的停车场和停放的汽车将逐渐消失，从而让出更多的空间。

对于通用人工智能（AGI）带来的所有这些可能的变革，我个人是充满期待的。

网友热议

总而言之，Karpathy将AGI看作更像是自动驾驶的发展，这一具体类比的观点，引发了众多网友的讨论。

「看到那个无法交付FSD的人，决定将FSD与AGI进行类比，实际上确实给了我信心，我们还有几十年的时间」。

OpenAI联创Karpathy发文：用自动驾驶诠释AGI！原贴已删速收藏

是啊，他好像忘记了「G」。我记得Norvig在几十年前的人工智能著作中曾说过，「智能」并不意味着无所不能，一个智能体要想有用，解决一个小问题就足够了。在我看来，这就是G的由来。

而我们现在却突然又回到了以前那个狭隘的定义？我仍然看不到从LLM和自动驾驶到AGI的路径。

OpenAI联创Karpathy发文：用自动驾驶诠释AGI！原贴已删速收藏

当然，AGI 的发展可能是渐进而缓慢的，就像我们看到Waymo打造自动驾驶汽车一样。但这只是众多方式中的一种，你也可以看到AGI通过非常不同的方式突然出现，就像通过扩展大规模LLM那样。

OpenAI联创Karpathy发文：用自动驾驶诠释AGI！原贴已删速收藏

参考资料：

https://web.archive.org/web/20240122062223/https://karpathy.github.io/2024/01/21/selfdriving-agi/

文章来自于微信公众号 “新智元”

OpenAI联创Karpathy发文：用自动驾驶诠释AGI！原贴已删速收藏

关键词: openai , Karpathy , AGI , 通用人工智能

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务，如比较价格、添加购物车、回复各种社交媒体等。
项目地址：https://github.com/browser-use/browser-use

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md