奥特曼回应一切:ChatGPT不是美国版微信,Sora是为假视频时代「打预防针」|附万字采访

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
奥特曼回应一切:ChatGPT不是美国版微信,Sora是为假视频时代「打预防针」|附万字采访
7379点击    2025-10-09 13:34

我们已经可以认真讨论「零人公司」这件事了。


2025 年 DevDay 现场,OpenAI CEO Sam Altman 在接受博主 Rowan Cheung 的采访时抛出了这个观点。语气轻松,但分量不轻。


数据支撑着他的底气:ChatGPT 用户周活跃用户突破 8 亿,周活跃开发者突破 400 万,最近发布的 AgentKit 让普通人几分钟就能搭建复杂 Agent,AI 也开始在数学和科学领域做出「小小的发现」。


这些成就背后藏着一个更深的问题:当 AI 能完成越来越多的工作,「工作」本身还意味着什么?在 Altman 看来,50 年前的农民无法想象坐在办公桌前敲键盘也能叫工作, 就像我们现在也无法想象未来人类会把时间花在哪些事情上。


奥特曼回应一切:ChatGPT不是美国版微信,Sora是为假视频时代「打预防针」|附万字采访


不同的是,这次转变的速度可能快到让人措手不及。


整场访谈中,Altman 展现出一种难得的坦诚。他承认 OpenAI 在某些测试上输给了竞争对手, 承认提前发布 Sora 是为了让社会接受假视频的冲击, 承认「AI slop」(AI 垃圾) 确实是个问题——但话锋一转,他补充道:人类自己也一直在制造烂活儿。


采访最后,Altman 耐人寻味地表示,他很羡慕现在 20 岁的创业者,因为有了 AI,机会空间「实在太广了」。


采访省流版:


关于产品发布和未来方向


核心重点是智能体(Agent):他个人对 Agent 的方向最感兴趣,并认为将 Apps 与 ChatGPT 结合会非常强大。


Agent Builder 是革命性的:他认为从 GPT Builder 到 Agent Builder 的最大飞跃是模型本身能力的巨大提升。现在的 Agent Builder 实现了「无代码革命」,让普通知识工作者也能轻松构建复杂的智能体系统,这是软件开发领域地震式的变化。


语音交互潜力巨大:他不认为语音是唯一的最终交互方式,但在许多场景下是一种非常自然、被低估的交互方式。


当前智能音箱体验不佳是因其背后的 AI 不够强大,而非语音交互本身的问题。


关于 AI 的发展和影响


开发速度将极大提升:AI 工具将使软件开发周期一降再降,让创业者可以极快地测试和迭代想法。


自主智能体即将到来:他认为,像 Code Interpreter 这样能独立完成「一周工作量」的智能体,可能很快就能实现,并非遥不可及的目标。


技术突破的关键在于更聪明的模型、更长的上下文处理能力和更好的记忆系统。


AGI 的核心是发现新知识:对他而言,AGI 最重要的衡量标准已不是通过某个测试,而是 AI 开始具备「发现新知识」并扩展人类知识边界的能力。他对此感到非常乐观。


社会将快速适应 AI:他以「图灵测试」被超越后社会迅速适应为例,认为人类也会很快习惯 AI 做出科学发现,以及适应由 AI 生成的、真假难辨的视频内容。


关于创业和商业模式


创业者的独特优势是在实践中发现的:他建议创业者从「有用、能跑得通」的事情做起,在过程中逐步发现并形成自己的长期优势(护城河),就像 ChatGPT 的「记忆」功能一样,是事后才发现其巨大价值的。


OpenAI 不想做「超级应用」:他们的目标是构建一个强大的「AI 超级系统」,而不是像微信那样的「超级 App」。因此,功能(如 Sora 视频生成)可能会作为独立应用存在,以适应不同的用户场景和心态。


Sora 等新产品的商业模式仍在探索中:他提到,可能会尝试让用户付费生成视频,并与授权肖像的名人进行「收入分成」,但最终的商业模式(按次计费、订阅或广告)将取决于产品的演化和用户的主流使用方式。


关于社会和未来


「AI 制造垃圾工作」是伪命题:他认为低效工作(slop)是人类固有的问题,而非 AI 独有。经济体系会自我纠正,最终奖励那些高效使用工具的人。


未来工作的形态会彻底改变:以「农民」作类比,他认为未来由 AI 创造的新工作在我们看来可能「不像真正的工作」,但人类依然会找到新的目标和意义。他担忧的是转型的短期阵痛。


需要全球性的 AI 安全框架:他认为,随着模型越来越强大,世界需要一个全球性的框架来降低潜在的灾难性风险,这个框架应从一个完善的「测试机制」入手。


奥特曼回应一切:ChatGPT不是美国版微信,Sora是为假视频时代「打预防针」|附万字采访


附上 Rowan Cheung 采访视频地址:https://www.youtube.com/watch?v=zwnVUiwObl8


另外,今天凌晨,Sam Altman 接受 a16z 的访谈视频也正式公开,我们也整理了其中几个值得关注的观点。


OpenAI 的核心愿景:


最终目标是构建通用人工智能(AGI)并使其对人类有益。


实现这一目标的主要方式是为用户提供「个人 AI 订阅服务」,这个 AI 将深度了解用户,并在各种设备和服务中提供帮助。


产品与 AGI 的关系(共同进化理论):


像 ChatGPT 和 Sora 这样的产品,不仅是消费级应用,更是实现 AGI 的关键步骤。


它们不仅能推动核心研究(如 Sora 帮助构建「世界模型」),更重要的是能让社会与技术「共同进化」,帮助公众逐步理解和适应即将到来的技术变革,避免技术成熟后突然冲击社会。


对未来的关键预测(AI 科学家):


Sam Altman 个人最兴奋的未来方向是「AI 科学家」。他认为,衡量 AI 的真正标准不是图灵测试,而是当 AI 能独立进行科学研究并做出新发现时。


他预测,在两年内,AI 模型将能够承担更大规模的科研任务,并做出重要的科学发现,这将是推动人类社会进步的巨大变革。


奥特曼回应一切:ChatGPT不是美国版微信,Sora是为假视频时代「打预防针」|附万字采访


商业与战略:


激进地投资基础设施:由于对未来的研究路线图和模型经济价值极度自信,OpenAI 正在进行大规模的基础设施投资,并与整个行业的众多公司(如 AMD、Oracle、NVIDIA)展开广泛合作。


对广告模式持谨慎开放态度:他认为广告并非完全不可行,但用户信任是绝不能破坏的底线。任何为商业利益而牺牲推荐质量的广告模式(如付费推荐产品)都是不可接受的,因为这会摧毁用户与 ChatGPT 建立的信任关系。


支持开源:他认为开源是件好事,并对自家开源模型的受欢迎程度感到高兴。提供高质量的开源模型也是一种重要的战略,可以为全球开发者和学术界提供可靠的选择。


关于版权和数据训练的看法:


他大胆预测,社会最终会认定,用于模型训练的数据属于「合理使用(fair use)」。


但他认为,直接用 AI 生成受版权保护的内容,则会出现新的规则和商业模式。


他观察到一个新趋势:许多版权方已经从担忧「AI 用了我的角色」转变为担忧「AI 用我的角色用得不够多」,他们希望在保证角色形象不受损害的前提下,通过 AI 互动来提升 IP 价值和粉丝粘性。


附上 a16z 采访视频地址

https://www.youtube.com/watch?v=JfE1Wun9xkk


奥特曼回应一切:ChatGPT不是美国版微信,Sora是为假视频时代「打预防针」|附万字采访


Rowan Cheung:现在是 2025 DevDay,你能不能总结一下今天公布了哪些内容?你个人又对哪部分最感兴趣?


Sam Altman:我对所有内容都很兴奋。嗯,我很关注 ChatGPT,这其实是我一直想做的事情——和人们聊聊他们在用它做什么。


智能体(agent)这个问题也让我很感兴趣,很多关于 agent 的内容我真的很想亲自用用。但如果非要说一个重点,我觉得 Apps 和 ChatGPT 的结合会非常棒。我很喜欢 Agent 这个方向。


Rowan Cheung:如果让我作为一个开发者去尝试一些酷炫的东西,那我可能会从那里开始。另外我们现在有八亿用户了,恭喜啊,这真的很了不起。显然,ChatGPT 已经成为下一个重要的分发平台。


现在开发者可以通过 Apps SDK 构建基于 ChatGPT 的应用,我觉得这是一个巨大的机会。


Sam Altman:我觉得我们还需要一些迭代,来摸索出人们真正想怎么用这些东西。比如:用户到底更倾向于通过调用某个应用来完成任务,还是希望 ChatGPT 本身就知道他们想干什么并主动推荐?


我认为,开发者最终会找到一种新的分发机制,非常适合他们。但说到底,这些产品推向世界后,总是会带来一些意想不到的惊喜。


Rowan Cheung:我记得你们也发布了一些文档,教大家怎么更好地被推荐,是吗?


Sam Altman:是的,不过也要加一句常规提醒:这是全新的产品,变化很快,我们会边走边学。但没错,这些文档我们今天就会发布。


几分钟部署智能体,软件开发真的在「地震」


Rowan Cheung:我很想读一读那些文档。嗯,我们来聊聊 Agent Builder(智能体构建器)吧,回到第一次 DevDay 的话题。


两年前,你们发布了 GPT Builder,那真的很棒。我记得我好像是最早构建公开 GPT 的人之一。那么,从那时候到现在,你们做了哪些重大改进,才有了今天的 Agent Builder?


奥特曼回应一切:ChatGPT不是美国版微信,Sora是为假视频时代「打预防针」|附万字采访


Sam Altman:最主要的变化就是模型本身变得更强大了。我们等下会谈到很多方面,但我回头想想那次首次 Dev Day,模型能力的差距真的非常大。虽然也就二十几个月,但我们已经走了很长一段路。


除此之外,我们还学到了很多用户想如何构建这种智能体工具。他们也希望能把这些智能体部署到 ChatGPT 之外的其他平台上。


我觉得最惊喜的是,现在构建一个复杂系统变得非常简单。比如你现在可以直接用一个可视化工具,把几个文件上传,配置一些数据源,告诉它你要实现什么目标,然后就可以部署了。整个流程只需要几分钟。


昨天我们还在内部演示,我第一次完整看了一遍整个流程。像 Code Interpreter(代码解释器)、Agent 工具包这些东西,加上整个构建体验,让我觉得软件开发经历了一场地震式的变化。我自己都还没完全弄明白这会带来多大的影响。


Rowan Cheung:如果我理解没错的话,在 Agent Builder 里,基本上可以零代码构建智能体对吧?


Sam Altman:对,完全可以。


Rowan Cheung:当然,懂点编程会更有帮助,能做更复杂的功能,但普通的知识工作者也可以上手构建。


Sam Altman:没错,人人都可以构建智能体。


Rowan Cheung:这听起来几乎就像是一次「无代码革命」,只是这次是针对智能体的。


Sam Altman:完全同意。就像你说的,懂一点或很多代码确实能做出更强大的东西,但最重要的是,现在的入门门槛已经非常低了,几乎人人都能开始尝试。


Rowan Cheung:你觉得这些变化会对下一波创业者或者开发者产生什么影响?


Sam Altman:这正是我最近一直在努力思考的事情。我在后台看演示时就在想——这些东西在一年前做起来要花费很长时间。而现在,你几乎可以实时做出来。说真的,我现在已经快跟不上点子生成的速度了。


我还不确定这会如何演变,但很明显,全世界将会有越来越多的软件被写出来。测试和迭代的速度会不断加快,开发周期会一降再降。


只是……我现在真的很难完全想明白这意味着什么。我觉得最明显的变化是:一切都会发生得更快,你可以快速尝试很多想法,更快地找到更好的方向。但除此之外,还会带来什么变化,我也说不好。


「一人公司」离我们只差几个 prompt


Rowan Cheung:我听说你和朋友之间还有一个打赌——猜测第一个靠 AI 智能体赚到十亿美元的公司会什么时候出现。你觉得 Agent Builder 会让这个目标更接近吗?


Sam Altman:可能还没到那个时候。嗯,之前我们打赌的点是:第一个「一个人公司」靠 AI 赚到十亿美元会何时诞生。虽然我们没正式立个规则,但大家一直在猜什么时候会出现第一个这种公司。


Rowan Cheung:那「零人公司」呢?是几个月,还是几年?


Sam Altman:我猜,可能还需要几年。但关键是——我们现在已经可以认真地去讨论这样的一天了。你可以直接在 ChatGPT 里写个提示词,然后它就能帮你搞定一切。


Rowan Cheung:这已经非常疯狂了,我完全同意。不过 2025 年原本被很多人认为是「智能体元年」。我们确实看到了一些还不错的智能体产品,但它们仍然需要大量人工监督和反馈。你觉得什么时候我们才能拥有那种一整周都不需要人干预的智能体?


Sam Altman:我觉得,像 Code Interpreter(代码解释器)这样的工具,距离完成「一周的工作量」其实已经不远了。虽然听起来有点疯狂,但我觉得这并不是一个遥不可及的 2025 年目标。


奥特曼回应一切:ChatGPT不是美国版微信,Sora是为假视频时代「打预防针」|附万字采访


今天我还和一些人聊起这事,他们也很惊讶地说:「它现在真的已经能完成一天的任务了?怎么发展得这么快?」老实说,我通常不会觉得 AI 的进步有多夸张,但在 ChatGPT Code Interpreter 能完成的任务长度这个方面,我真的感受到一种爆炸式的进展。所以我猜,一周级别的任务,可能真的很快就能实现。


Rowan Cheung:那要实现这种 Agent,还需要哪些技术上的突破?


Sam Altman:更聪明的模型、更长的上下文处理能力、更好的记忆系统。


Rowan Cheung:好的。你们现在有了 AgentKit、持续升级的模型、Codex,还有 API。看起来现在真的能构建太多东西了。那如果你回到过去,把一个刚从斯坦福退学的 20 岁年轻人带到现在,并让他拥有我们今天所有的工具,你觉得他该做什么,不该做什么?


Sam Altman:我前几天其实还真在想这个问题。老实说,我挺羡慕现在这代 20 岁的创业者们的,因为他们能做的事情太多了,机会空间实在太广了。过去几年里,我一直没腾出真正完整的时间去深入想「我要做什么」,但我知道现在有非常多值得构建的好产品。今天和现场很多人聊天,也被他们正在做的项目震撼到了。真的很棒。


Rowan Cheung:我自己也是从零开始,我觉得现场很多开发者可能也是这种状态。现在能做的东西太多了,你有没有什么建议?比如说,在构建产品时,应该寻找怎样的「独特优势」?是分发方式?数据?还是某种工作流模型?


Sam Altman:这个问题抽象地讲我一直觉得挺难回答的。因为我认为最好的「独特优势」,往往是你自己为你要做的事情量身打造的。我们在 OpenAI 也花了很多精力去找到这一点。我觉得这没有通用的「最佳答案」。


最好的回答应该是:你找到了一些,只对你当前产品、技术、市场定位在这个时间点上才成立的独特东西。而这类东西,往往就构成了你能创造巨大价值的核心。


不过,有一点通用的建议我可以说:你是在做的过程中逐步发现优势的。我很喜欢一句经典的商业名言——「让战术变成战略。」


你可以先从一些「有用、能跑得通的事情」开始,往往在这个过程中,就会慢慢浮现出某些可以上升为战略的东西。


如果你在我们刚开始做 ChatGPT 的时候问我:「你们未来会有什么持久的优势?」我可能会说「我也不知道」,或者给你一堆猜测,但不会有特别自信的答案。


但现在回头看,像「记忆」功能,其实就成为了一个非常强的竞争优势,也是用户持续使用 ChatGPT 的重要原因之一——可当时我们压根没想到这点。


所以你在构建功能时,有时会意外地发现:「哇,这个点其实可以成为我们长期的护城河。」这就是你一边走、一边找、慢慢形成的过程。


Rowan Cheung:有没有什么迹象能告诉我们,现在在构建产品时应该朝着哪种「长期优势」去努力?比如说该怎么为 GPT-6 时代布局?或者说,现在到底该怎么思考产品构建这件事?


Sam Altman:这个嘛,最终还是得你自己去摸索出来。当然如果有时间我很乐意参与头脑风暴,这事儿本身就挺有趣的。


但说实话,OpenAI 现在几乎占据了我全部的脑力空间,我已经没有什么机会去认真思考怎么创业了,这点其实还挺遗憾的。


我觉得 AI 虽然改变了世界上很多事情,但它并没有改变一个公司获得优势的底层机制。


比如说,网络效应、品牌和市场优势、用户数据、平台或市场的双边效应等等,这些因素过去行得通,现在依然有效。如果你去列一个近几年成功企业的清单,那些驱动力大概率现在也还适用。只不过,现在可能会有一些新的策略、新的打法罢了。


奥特曼回应一切:ChatGPT不是美国版微信,Sora是为假视频时代「打预防针」|附万字采访


Rowan Cheung:最近发布了一个叫 GDPval 的基准测试,用来衡量模型在现实经济中、尤其是典型知识工作岗位上执行任务的能力。让我有点意外的是,GPT-4.5 的表现排在第二,第一名是一个封闭服务模型。你们还没发布 GPT-5,但你对这个结果感到惊讶吗?


Sam Altman:一点也不惊讶。首先,如果我们只能在排名第一的时候才发布产品,那就太糟糕了。我们不可能在所有事情上都做到最好,这很正常。想要长期变得更好,文化里必须包含一个元素:坦然承认在某些基准测试上别人更强。


有时候别人就是做得比你好。说实话,那家公司确实在理解企业级使用场景上做得很出色,而且输出格式也非常漂亮。我并不惊讶,反而觉得这激励我们继续提升。


Rowan Cheung:这个基准测试有没有影响你们在构建 GPT-6 时的方向?


Sam Altman:它会影响我们后续训练(post-training)的一些方式,但整体上我们对 GPT-6 的核心策略是不会改变的。


Rowan Cheung:你之前说过,你对 AGI(通用人工智能)的定义是:当它在大多数具有经济价值的任务上超过人类。那么,如果某个模型在 GDP-V 的得分达到某个程度,你会认为 AGI 实现了吗?


Sam Altman:我最近也在认真思考这个问题。首先,像很多人一样,我对 AGI 也有多个定义。离目标越近,这个概念反而越模糊。


但对我来说,最重要、也是让我最惊喜的一点是:我们已经开始看到 AI 具备「发现新知识」的能力了。也就是说,AI 可以扩展人类目前的知识边界。虽然现在这些例子还很小,但这才是我最在意的突破。


我真的不想把这件事说得太夸张,但你现在可以在 X 上看到很多例子,科学家们在各个领域都在说:「AI 做出了一个小小的发现」、「它提出了一种全新的方法」、「它解决了某个我们一直没解开的难题」。而这些背后的原理,我们可能也还没完全理解。


就是这种感觉。现在还只是刚刚开始而已,而我们对未来几个月、几年能在这个方向上持续推进感到非常乐观。这件事意义非常重大。它可能是我最关心的、最接近 AGI(通用人工智能)的那部分能力。


APPSO 注释:在 a16z 的采访视频中,根据 Sam Altman 的观点,OpenAI 的整体愿景和核心使命非常简单,那就是打造通用人工智能(AGI)并让它真正为人类服务。实现这一宏大目标的主要方式,是为每个人提供一种「个人 AI 订阅服务」。这个个人 AI 将随着时间推移深度了解用户,变得越来越有帮助,并且用户可以在 OpenAI 自家的产品、登录其他第三方服务,甚至在专属硬件设备上随时使用它。为了支撑这一切,公司必须构建庞大的基础设施,这些设施目前主要服务于这个核心目标和相关的研究。


他强调,如此大规模的基础设施投入远超单个公司的能力,需要获得行业大部分力量的支持与协作。因此,OpenAI 将与众多公司展开广泛合作,合作范围覆盖从底层的电力、电子供应到上层的模型分发系统等所有环节,并且可以预期在未来几个月里会宣布更多新的合作关系。


Rowan Cheung:有没有哪个具体的科学突破,是你特别兴奋、特别希望 AI 能帮我们实现或解开的?


Sam Altman:当然了,比如说治愈某些疾病,或者发现全新的物理规律,这些都是非常令人兴奋的方向。即使是现在正在发生的一些「小事」,也同样令人振奋。比如在数学领域的一些进展,也给人一种特别振奋的感觉——就像 GPT-4 刚发布时带来的那种冲击感。


我知道大家对「图灵测试」到底是什么意思还存在很多争议,但从大众的角度来看,图灵测试曾经是一个看起来遥不可及的目标。然后,突然之间,它被「通过了」。可整个社会几乎没有什么反应。


奥特曼回应一切:ChatGPT不是美国版微信,Sora是为假视频时代「打预防针」|附万字采访


人们可能讨论了两周,然后就开始说:「这玩意儿怎么还这么慢?」、「能不能再做得更好点?」我觉得这其实也说明了人类的伟大——我们非常善于适应。曾经被视为衡量 AI 智能的终极测试,突然之间就被超越了,而我们也很快就习惯了。


我现在有种类似的感觉:我们也会很快习惯 AI 做出科学发现这件事。


Rowan Cheung:感觉有点像电影《Her》里人类适应 AI 的情节。


Sam Altman:是的,只有第一次觉得奇怪。


Rowan Cheung:没错,奇怪也就那三分钟,之后你就习惯了。嗯,我确实感受到了这种趋势。最近有一个新术语叫做「slop」,意思是那些看起来很精致、但其实很低效的工作成果。它们通常需要反复返工才能真正有用。


一项针对上千名测试用户的调查显示,有 41% 的人表示他们在过去一个月里,曾从同事那里遇到过这种「slop」工作流。每次「清理烂摊子」平均花费 1 小时 6 分钟,每名员工每月因此造成的损失大约是 100 美元。


那么,如果 AI 能够让部分人(比如在这个活动现场的很多人)效率提升 10 倍,我们该如何进行教育?如何帮助老师和普通人理解:什么时候该用 AI,什么时候不该用?


Sam Altman:首先,要说的是,人类自己其实也常常制造「slop」工作流,所以这并不是 AI 独有的问题。比如那种「写邮件只是为了制造更多工作」的人,你懂我意思吧。


就像会议也是一样,明明是为了协作,结果反而变成拖累。所以「slop」不是新现象,它在 AI 出现之前就已经存在了。过去就有一类人会用工具提高效率,也有另一类人只是在制造混乱和负担。


我觉得我们也没必要对 AI 抱有不切实际的期待。经济体系是自我纠正的——那些真正用工具提高效率的人和公司,最终会获得更多影响未来的能力;而那些用 AI 拖累组织的人,会自然被边缘化。


像所有新工具一样,AI 的使用也有学习曲线,但我相信这个学习过程会相对快速。


Rowan Cheung:那 OpenAI 有没有做什么事情来帮助大家在教育和入门阶段更好地掌握这种「使用直觉」?


Sam Altman:有的,我们确实在做这方面的工作。人们使用工具的方式就是他们自己的方式。有一件事我学到了,那就是:哪怕你提供了再好的教学内容、培训资源,最后人们还是会发现他们可以用它来——比如说,让 ChatGPT 模仿海盗说话,然后他们就真的去这么做了(笑)。


但我们确实在努力创建很多内容,帮助人们在真实工作场景中高效使用 AI。比如在 Codex 的推广过程中,很多公司采用它的速度非常快,甚至在几天或几周内就完成了工作流程整合,效果非常好。


奥特曼回应一切:ChatGPT不是美国版微信,Sora是为假视频时代「打预防针」|附万字采访


Rowan Cheung:回到 「slop」 这个话题,其实这是世界上第一个「以 AI 为中心」的工作年。


Sam Altman:是的,可以说是整个互联网都在经历这个转变。


Rowan Cheung:你会不会觉得,这种变化也像你之前提到的——目标设得太高,比如 GPU 的使用、算力的投入,等等?


Sam Altman:其实这是我原本以为会很奇怪的事情,但结果出人意料地没那么怪。甚至有点反常识——你翻看上百个例子,反而比你只看一个还要自然一些。


我当时一边看,一边还在想这个问题。对了,我还刚完成了一次环球旅行……


在产品上线前,团队里有个人发消息问我:「我们能不能把你的那个骆驼形象开放访问?」那一刻我几乎没想太多,8 秒内就回复了同意。但后来想想,其实这事儿也许值得更认真考虑一下。只是当时我心里也想——这是一项新技术。


我知道,如果我连尝试都不愿意,那确实是我的问题。所以我就决定:那就试试吧。后来我坐飞机的时候,终于有点时间思考,就开始想:


「这会不会是一次很奇怪的体验?」


然后我自己回答自己:「嗯,可能确实会有点怪。」


结果产品上线之后,我看到一些苗头了——因为 OpenAI 内部的人在测试期间,已经做了很多以我和其他人为主题的 meme。


那天我人在亚洲,半夜醒来发了条推文,就又睡回去了。六小时后醒来,我打开手机一看:全是 meme、meme、meme……


奥特曼回应一切:ChatGPT不是美国版微信,Sora是为假视频时代「打预防针」|附万字采访


就这样被刷屏了。


最初几分钟确实觉得有点奇怪,但也就三分钟而已。之后我就释然了,觉得:「好吧,这就是一个充满生成视频的应用。」这些内容挺搞笑的,我也能乐在其中,笑一笑就过去了,并没有留下什么奇怪的感觉。


Rowan Cheung:我唯一有点担心的是那些「水印移除工具」。现在市面上有几家公司发布了这种功能,我看到有工具可以移除水印。


那如果我允许别人用我的形象,他们之后可能会把水印去掉再发到社交媒体上。这样会不会对我的个人品牌有负面影响?这个权衡该怎么做?


Sam Altman:首先,我们之所以愿意发布这种技术,是因为我们看到某些趋势已经不可避免地在靠近——无论几个月还是几年后,它都会变得广泛可用。届时会有优秀的开源模型,任何人都可以用它制作一段你的视频,让你「做」任何他们想让你做的事情,只要你在互联网上有公开资料,就有可能被生成。


当然,社会最终会适应这种变化,但我们认为,提前发布并设置好「防护栏」,是一种帮助社会逐步适应的好方法。我们以前在文本生成技术上也是这样做的。


视频则会更难适应,因为视频的冲击力远大于文字。


但我相信大家会学得很快——会很快意识到:网上将会出现大量没有水印、来源难以追踪的虚假视频,它们是由某个开源模型生成的,这种事是不可避免的。


所以,提前让社会「接种」这种现实的冲击,可能是有价值的。


Rowan Cheung:所以,「无法分辨真伪的视频」是目标吗?


Sam Altman:我们最终的目标是 AGI(通用人工智能)。在实现 AGI 的过程中,高质量的视频生成会是非常重要的一环,原因有很多,特别是在我们从「世界模型」中学习的时候。


希望有一天我们能在机器人领域也取得真正的进展,那时视频也会非常关键。


而且我并不希望未来人类与 AI 的交互界面只有文字。我非常期待那种可以通过实时视频流与 AI 互动的未来,它能带来一种全新的用户体验。


所以我觉得这是好事。但更重要的是,我认为这条路对于通向真正的 AGI 来说,是非常关键的一步。


Rowan Cheung:你们上周五发了一篇博客,说你们正在探索「收入分成」机制,回馈那些允许用自己面孔生成内容的人。你可以多分享一些细节吗?这机制会怎么运作?


Sam Altman:可以。其实很多时候你发布一个新产品,用户的使用方式会超出你的预期。


我们原本以为会是少量创作者在用它制作一些很酷、很复杂的视频,然后被更大的观众群体观看和传播。


确实有一部分人是按照我们预期的那样在用这个产品,但实际上,更多人是为了自己和三两个朋友制作视频,然后发在动态里,或者只是在群聊中分享一下,不是公开发布在平台上。


我不确定这种用法是昙花一现的新鲜感,还是会持续下去。但如果它真的持续下去,那就会彻底改变我们对计算资源需求和用户互动方式的预期模型。也许我们会考虑允许用户付费生成视频。


比如说,你一天想生成 100 个视频发给朋友,那没问题。如果你还想让视频里出现某个名人,而那位名人愿意授权,那么他们也可以从中获得一定的生成收入分成。所以我们会在这方面做些尝试。


但我也得说,现在就对一个只有六十天的新产品下任何定论都还为时过早。也许这个方向最终根本不成立,也许这根本不是一个真正的「使用场景」,但至少到目前为止,它是一个挺大的趋势。


Rowan Cheung:你们有没有考虑过在这个产品里加入广告的可能性?


Sam Altman:目前还没有,但我觉得这个方向确实有一些值得探索的地方。当然,它也有一些让人感到非常可怕的潜在风险。


不像 ChatGPT,那边我们已经跑得挺顺,有清晰的订阅制商业模式。而如果这个视频产品最终的主流用法变成:大家看搞笑内容或高质量视觉内容——那可能就更适合走广告驱动模式。


但如果大多数内容都是私密分享,比如私信里的视频,那就可能是完全不同的模式。


所以乐观来看,也许到今年年底——或者这可能太乐观了,可能要等到明年第一季度末,我们才能真正理解这个产品的最终形态,然后再根据它的走向设计相应的商业模式。


至少目前来看,我觉得按次计费、按生成数量收费,是一个合理的方式,值得我们去尝试。但其他的商业化策略,还要看产品接下来如何演化。


APPSO 注释:在 a16z 的采访中,Sam Altman 也强调,他对在产品中引入广告持谨慎的开放态度,并区分了他欣赏的广告(如 Instagram 上帮助用户发现新事物的模式)和不喜欢的广告(如 Google 搜索中干扰结果的模式)。


他强调,对于 ChatGPT 而言,用户的信任是绝不能破坏的核心原则。人们相信 ChatGPT 是真心想提供帮助,如果为了广告费而推荐并非最佳的产品,这种信任会瞬间崩塌,因此这种直接影响结果的付费推荐式广告是绝对行不通的。


未来的工作,可能也「不像工作」


Rowan Cheung:这个话题真的很有意思,关于「工作」的问题。工作的形态正在改变。我喜欢用「农民」类比来解释这件事。


比如你对 50 年前的农民说,有一个叫「互联网」的神奇东西,会创造出数十亿个新工作岗位,而且人们会坐在办公桌前工作、开发市场……他大概率是不会相信的。


现在我们正处在一个类似的时代——你和很多人都说过,AI 会创造出很多全新的岗位。但现在很难看清这些新工作会是什么。


这次和「互联网时代」的不同之处在于:互联网是从零开始创造了很多新职业,而这次 AI 的冲击,是先影响现有数十亿知识工作者的岗位,然后才可能出现新的工作机会。你怎么看?


Sam Altman:你说得非常对,我觉得你点出了一个很关键的点——这让我在某些方面没那么担心,但也在另一些方面更担心了。


关于那个农民,不只是他不会相信这种事真的会发生,他甚至可能会觉得你我现在做的这些根本不算「真正的工作」。


你想啊,农民每天种地,是在做大家真正需要的事——他们在生产粮食、维持生命,这才是「真正的工作」。


而在他们看来,我们这些未来人,生活太容易了,食物和财富都很丰富,我们做的事情更像是打发时间的「游戏」,只是为了找点存在感。他们会说:「这算哪门子工作?」


尽管对我们来说这份工作很真实,至少我自己感到很满足,也很感激自己能做一份既重要又有意义的事。


但也完全有可能,如果我们现在能看见未来那些新工作,我们会说:「好吧,也许我们的工作比不上农民的真实感,但肯定比未来这些『自娱自乐的游戏』更像工作。」


所以我真的相信——是的,人类将来依然会有目标、有动力,但我们对「工作的理解」会发生巨大变化。在未来人眼中,我们现在的工作,可能也会显得「不那么像工作」。


我也相信,社会契约会随之改变,尤其是当这个转变发生得非常快的时候。


所以我确实对这场转型的短期阶段感到有些担忧。但说到底,我依然非常相信人类的动力与创造力,我们一定会找到值得去做的事情。


Rowan Cheung:比如探索太空,希望看到更好的 AI 系统等等——你觉得在 AGI 实现之后,人类最有可能会集中精力去做什么?


Sam Altman:我其实更希望——我们能「全面开花」,什么方向都去探索。


太空探索当然很酷,我自己也很感兴趣。但也许你、你,还有你,各自会对别的方向感兴趣。我希望那个时代的「可能性画布」能变得无限宽广,大家都能去做自己真正感到兴奋的事。


Rowan Cheung:如果你明天可以制定一项全球性政策,你会选择什么?


Sam Altman:这真的很难只选一项。但我脑海里一直浮现的,是关于 AI 监管的激烈争论——到底它是好是坏?是否会让大公司获利太多?


我能理解这些争议的各个方面。但我确实认为,随着模型变得越来越强大,我们需要一个全球框架,来降低潜在的灾难性风险。


尤其是在那些处于前沿的模型上,我们必须认真思考最严重的安全问题。如果能有一项全球政策来应对这个问题,那将是非常有意义的。


Rowan Cheung:你能简单概括一下这个「全球框架」会是什么样的吗?


Sam Altman:一开始我会从一个完善的测试机制入手,作为基础。


奥特曼回应一切:ChatGPT不是美国版微信,Sora是为假视频时代「打预防针」|附万字采访


Rowan Cheung:我还想聊聊「超级应用」这个话题。在中国,像微信这样的「超级 App」已经涵盖了几乎所有功能:购物、支付、聊天……


而现在 ChatGPT 也开始支持购物、网页搜索、Sora 视频生成等功能。你们是不是也打算打造一个「美国版的超级 App」?


Sam Altman:不是的。嗯,有很多原因让我觉得这种模式在美国市场并不适用,至少不能用同样的方式去复制。


我们的目标并不是做「超级 App」,而是要构建一个真正强大的 AI 超级系统。


Rowan Cheung:那为什么你们要把这些功能分开发布?比如 Sora 是一个独立的应用,为什么不直接集成到 ChatGPT 里?


Sam Altman:因为对很多用户来说,ChatGPT 是他们最私人的账号之一。


如果把一个「社交体验」也强行塞进去,感觉会很奇怪。你可以想象加入一些「消息」功能,因为很多人确实会分享内容、进行协作。但从用户心态来看,他们对 ChatGPT 的认知,和对一个娱乐类 App 的认知是完全不同的,混在一起会有割裂感。


当然,我们也会把很多功能直接加到 ChatGPT 里,但有些东西还是更适合独立发布。


Rowan Cheung:我们再聊聊智能体。你觉得现在人们可以构建哪些真正重要、有用的 Agent?你最看好哪一类?


Sam Altman:我觉得可以参考一下 Codex 的发展,然后把这种思路推广到其他行业。


比如:能不能为法律、金融建模,或其他我们已经看到早期成功案例的领域,打造像 Codex 一样的体验?其实现在已经有一些很棒的初创公司在做这些方向了。


随着技术的成熟,如果你能让这些 Agent 在各自行业中,做到像 Codex 在编程领域那样强大,那将是我最感兴趣的方向之一。


我可以想象未来这样的场景:一个人只需要和一堆 Agent 对话,就能启动一个公司。现在的 Agent Builder 和 AgentKit 还没完全达到这个水平,但我能看到我们正在往这个方向靠近。


Rowan Cheung:我记得你在主题演讲里提到,「语音」可能会成为 AI 智能体的最终界面。你能展开讲讲吗?


Sam Altman:我不觉得语音是最终的交互方式。很多场景下,语音其实并不适用——比如在公共交通上,和设备对话就很不方便,甚至有点尴尬。


但在很多情况下,语音确实是一种非常自然的交互方式,尤其是语言本身的交流。尽管有时候,打字仍然是更合适的方式。


奥特曼回应一切:ChatGPT不是美国版微信,Sora是为假视频时代「打预防针」|附万字采访


我觉得我们其实低估了语音交互的潜力。大家现在总是拿智能音箱这个类别开玩笑,但我们忽略了,其实很多人真的在用这些设备,而且很喜欢它们——尽管它们现在的体验还很差,主要是因为以前的 AI 不够好,生态基础也没跟上。


但你想想未来会怎样:如果你能随口对设备说一句,它就能完全准确地帮你完成任务——那种感觉,可能就真的像拥有了一个「理想中的计算机」。


Rowan Cheung:我很期待能够使用它。能不能透露一点关于你们在 I/O(设备端)正在做的事情?是不是会有语音交互?


Sam Altman:我们还需要一段时间。这个方向确实需要大家多一点耐心。


要做出一种全新类型的设备,而且要达到极高的品质标准、还能大规模生产,这等于是重新定义人与计算机的交互方式。我们需要一定的创作空间来把这个事情摸索清楚。


我们确实有一些非常令人兴奋的想法,但目前还不准备公开谈论,而且在短期内也不会说太多。但我们会努力做出一个真正值得使用、非常有意义的产品。


Rowan Cheung:好吧,那今天就聊到这。


Sam Altman:非常感谢。



文章来自于微信公众号 “APPSO”,作者 “APPSO”

关键词: AI新闻 , ChatGPT , 奥特曼 , OpenAI
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

4
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0