苹果面临AI领域挑战,隐私与数据控制成焦点。
9月10日,苹果召开了2024年秋季新品发布会,正式发布了历史上的第一台AI iPhone。iPhone从诞生到现在已经成为全球最具标志性的智能硬件之一,持续引领着智能手机行业的发展。然而,随着大模型技术的崛起,苹果的领先地位似乎正面临着前所未有的挑战。
在这次发布会中,苹果展示了其在硬件和软件上的进展,但相较于OpenAI等公司在大模型技术上的突破,许多人开始质疑:苹果是否已经在这场大模型竞赛中落后了?与此同时,苹果一直以其严密的隐私保护机制而闻名,但在AI时代,数据的获取和利用变得至关重要。苹果是否能够在继续保护用户隐私的同时,推动AI技术的进步?这种平衡变得越来越难以把握。
除此之外,未来AI硬件的载体是否仍然是手机?随着智能眼镜、手表等设备的迅速发展,手机作为主流硬件的地位似乎正受到挑战。苹果能否继续依赖iPhone的强大市场份额,还是需要探索其他形式的硬件设备来适应AI时代的需求?
更为关键的是,苹果要实现其“万物皆AI”的愿景还面临着技术与战略上的巨大挑战。从终端产品的整合到芯片设计的突破,苹果在实现这一目标的过程中,还需要解决哪些难关?这些问题不仅关乎苹果的未来,也关乎整个科技行业的演变方向。
为了探讨这些核心议题,我们邀请到了两位行业资深人士,他们将为我们深入分析苹果当前的处境、挑战与未来发展方向。接下来,我们将听取他们的专业见解,解读苹果在这场智能革命中的角色与前景。
嘉宾
王煜全 海银资本创始合伙人、Frost&Sullivan中国区首席顾问
作为风险投资⼈,资深市场营销和战略投资专家,对全球的科技创新都有最新的观察和思考。
李楠 怒喵科技创始人、CEO;前魅族科技 CMO 兼公司高级副总裁、魅蓝总裁
作为资深的手机行业从业者,对硬件及消费电子产品的创新,有着独到的理解。
郑可君 腾讯科技主编
图:Apple Intelligence——适用于 iPhone、iPad 和 Mac 的个人智能系统
总结:苹果的核心挑战在于硬件与软件周期的平衡,需在兼顾旧设备兼容性与抓住新技术革命间做出选择
腾讯科技:怎么评价这场发布会?看完后感受如何?
李楠:这些年来,苹果每年的发布周期是固定的,它的发布会一直存在同样的问题——确定性太强了,以至于我即便不看也能猜到他们会做什么,毫无惊喜。
王煜全:我认为苹果并没有这么不堪。它过去的策略,和现在有所不同了。
过去苹果更多的是处于“evolution”的阶段,这种进化过程中的硬件预埋策略是非常有效的。
它的做法是,在推出任何新应用时,确保前三代手机都能支持,因此在某些功能推出时不会立刻应用到最新机型上。
这也是为什么我们总是感觉苹果推出应用的时间总是比其他公司要晚。这并不是苹果没有能力立刻推出,而是因为它要确保旧机型也能兼容,这个策略在以前是可行的。因为换手机的周期大概是3到4年,因此,当三代手机都能支持一个应用时,市场上就有80%的苹果设备能够使用该功能。这个策略支撑了苹果的应用生态,特别是App Store的发展。
然而,当今市场的变化带来了新的挑战。如今的革命(revolution),与过去的渐进进化不同。这种革命性的变革迫使苹果思考是否要继续沿用旧策略,是否仍然要等待三代手机都能支持新技术再推出新功能。
例如,苹果这次推出的A18芯片,标榜为支持Apple intelligence的第一代芯片。那么苹果是否要等到市场上有三代手机都搭载了A18芯片,才推出全面的人工智能应用呢?如果这样的话,可能等到那个时候市场早已发生了巨变,这样苹果就会失去革命的时机。
因此,苹果面临两难的选择:是继续背负过去的用户基础,延续之前的策略,还是抛开旧用户,轻装上阵,快速跟进新的技术潮流?诺基亚就是这么死的,但是很多时候,后人没有办法吸收前人的经验,还是会做一模一样的选择。
总结:创始人和职业经理人在面对风险与机会时,决策的出发点可能大不相同,库克的稳健与责任使他做出了更保守的选择。
王煜全:说到底,还是创始人和职业经理人的问题。Tim cook是一个非常典型的经理人,我们已经预期到这是一场革命。我们也预期到苹果在这个革命当中有很大的优势,但是我们依然会知道苹果还是会采取保守策略,以至于可能会错过这场革命。
腾讯科技 :如果他是创始人,可能会选择放手一搏,抓住一个机会后全力以赴。而库克带领苹果已经13年了,他可能更倾向于稳健发展,确保股价稳定,对投资人有交代,同时也要考虑到维持大批员工的生计。这是他必须优先处理的事情。尤其是在去年大语言模型技术还未完全明朗的背景下,库克的选择可能更为谨慎。
总结:苹果在AI领域已经完全踏空了,它传统的芯片和操作系统优势已不再是核心竞争力。
李楠:事实上苹果已经错过了这场革命。我们都知道,苹果这几年一直在不断收购公司,但它并没有收购任何一家真正涉及大规模语言模型(LLM)的公司。苹果所说的AI与今天我们所提到的大规模神经网络完全不同。
首先,我们需要明确AI的概念。在大规模神经网络的语言模型领域,苹果完全没有核心能力。它与中国一些依赖开源技术的公司水平差距不大。虽然苹果拥有一些专利,比如通过识别画面来预测用户意图的技术,但与中国其他品牌相比,并没有显著差距,这也是它为什么需要接入GPT-4o的原因。
因此,苹果确实错过了2023年3月由OpenAI发布GPT4所引发的大规模语言神经网络革命。在2023年3月之前,苹果拥有两个核心技术:芯片设计和操作系统。但当大规模神经网络成为算力的中心时,计算的方式从冯诺依曼架构转向了大规模神经网络,这使得苹果的这两项核心技术不再具备优势。这是苹果多年来首次未能掌握最高价值的算力部分。
基于原生多模态数据训练的GPT-4o发布后,整个领域的进展非常迅速。我们持续跟踪所有模型的性能和进展时,感受到的速度非常惊人,完全像我刚毕业时在互联网早期写程序的感觉——几乎每天都有新的东西出现。
而iPhone是一个拥有7000万台级别的量产产品,驱动着全球供应链,它的软件功能已经非常复杂了。在这种情况下,苹果不可能毫无准备地跟上如此迅速的技术变化。
这说明两点:第一,苹果在转型时确实非常难以掉头;第二,它在AI领域完全踏空了,显得非常被动。
总结:苹果拥有“金矿”,它在本次革命中还有机会,其核心优势在于对用户行为数据的掌控,即使在当前的智能革命中行动缓慢,未来它依然具备凭借这一控制力引领行动智能的潜力。
王煜全:刚才李总提到,这次苹果发布会表现平平无奇,所以大家的反应很正常,但苹果的股票并没有大跌,原因很简单,尽管发布会没有惊喜,但苹果的终端实力依然存在。
对此,我与李总的看法不完全一致,我不认为这一轮的革命是由大模型主导的。大模型主导的是上一轮革命,不管是大语言模型还是其他类型,它们的核心都是内容。比如OpenAI的核心价值就在于它利用了整个互联网的数据进行训练。
我们需要把话题扩展一下。人工智能时代还没有真正的思想家诞生,而在之前的互联网时代,像凯文·凯利这样的思想家曾出现过。在无线互联网时代,这样的思想家没有出现,导致了巨大的误解,很多人以为无线互联网只是互联网的无线化,实际上它有本质区别。互联网的核心在于内容的聚集,因此会诞生大模型,而我们称之为内容智能。
但无线互联网是关于行动的汇集,是第一次大规模地采集和分析人类行为。所以我们称之为终端智能,它是行动智能而不是内容智能。在行动智能领域,手机厂商拥有很大的控制力,因为用户的行为被手机厂商记录和分析。我认为,只要这种行动控制力没有被打破,苹果的优势依然明显。
虽然苹果在行动智能方面还没有布局,甚至可能意识还不够深刻,但等到它真正想做的时候,其他公司未必能超越。因此,苹果的优势依然牢牢掌握在自己手中。
现在我们大部分的手机行为都是通过App实现的,而这些App的底层实际上由苹果主导。如果苹果想打通这些App,它是有机会的,但如果它不愿意,外界的第三方App想打通的可能性非常小。
这就意味着,苹果拥有“金矿”,如果它不去挖掘,别人也没法挖。以前我在为移动做顾问时也看到过类似的情况,直到某一天无线互联网真正打开,篱笆才倒塌,这才让其他人有了机会。这道篱笆何时倒下,可能还需要一些时间。所以苹果的逻辑很简单:如果它不推动革命,外界也难以掀起革命。
OpenAI的这种“革命”,它更多是延续了互联网的逻辑,我认为这并不是终端智能的本质。目前手机上运行的多个App之间是割裂的,过去我们都体验过这种痛苦,比如搜索功能越来越低效,因为内容被分散在各个App里。当你的行为也被分散化,导致任何一个平台对你的认知都是不完整的,无法整合。
然而,苹果对用户的认知却越来越完整。通过手机、手表等设备,苹果对用户的行为掌握得非常透彻。所以,它的自信并非没有根据。虽然这种自信对我们用户可能并不是好事,但它确实是存在的。
总结:算力的变革正在改变软件和硬件的格局,核心竞争力在于为用户提供独特的高价值体验,OpenAI目前在这方面领先于苹果。
李楠:我是做产品的,喜欢用最简单的大白话把问题说明白。我们在做硬件产品时,常说一句话:“软件决定硬件”。其实还有一句话我们通常不提,但它是存在的:“算力决定软件”。过去几十年,算力一直是基于冯诺依曼架构,所以这句话不需要多说,但完整的逻辑就是这样。如今,算力发生了变化,软件也随之改变。如果过去是Photoshop这样的软件主导,现在则可能是Midjourney这样的AI软件。因此,软件变了,硬件也必然会跟着变。
图:冯诺依曼架构
我想强调两点:
第一,算力决定软件,算力发生革命性变化时,软件也会随之变革,提供这些软件的公司大概率不止一家;
第二,软件决定硬件,当软件变革时,硬件也会随之改变,而提供硬件的公司大概率也不会只有一家。与此同时,我要强调最后一点:所谓的“入口论”没有用户价值作为支撑。你并不是因为掌握了入口而变得强大,而是因为你为用户提供了超越的价值,不能倒置因果。核心在于提供独特的最高价值能力。客观来说,今天能提供这种能力的是OpenAI,而不是苹果,我现在已经不用苹果手机了。
我还想分享一个调研结果:我们在美国的Discord群里有几万名真正的消费者,其中一些人买了Meta眼镜。我们调研他们对Meta眼镜的不满之处,气其中有一个原因就是Meta眼镜不能使用GPT-4o。Meta眼镜卖出了200万副,但实际上,消费者并不是在购买Meta眼镜,而是购买Llama。然而,消费者觉得Llama3不够好,所以他们希望使用GPT-4o。
总结:手机终端在行为智能上的潜力巨大,能够直接执行指令,而OpenAI的GPT-4o目前仍局限于内容层面的辅助功能。
腾讯科技:在AI时代,手机终端与大模型平台的结合逐渐成为焦点。两位认为,苹果在这一领域的开放性是否会影响其竞争力?手机终端的潜力又如何在这一场竞争中发挥作用?
王煜全:我认为,当一场革命来临时,沿用过去的推论来预测未来是很危险的。现在最好的工具当然是OpenAI,我也同意这一点,但认为OpenAI就是一切的前提是没有预见到未来可能会有新的革命发生。而我认为革命是存在的。我们不要忘记,最近一个热门的话题就是数据垄断。我前几天刚写了一篇关于“数字封建主义”的文章,谈到各个数字平台正在形成垄断。
举个例子,我希望手机能够通过调用我的App来完成任务,比如我对Siri下指令说“请帮我订餐”,它就能直接完成。但说实话,OpenAI目前是做不到这一点的,因为底层API很难对第三方开放,而手机终端是有可能做到的。现在苹果还没有完全开放第三方的API。
不过,苹果的手机已经在很多底层技术上实现了打通,比如视频处理功能。其实我最期待的是OpenAI的GPT-4能够直接打开摄像头,实时识别视频内容并与我互动。但目前它只做到了拍照功能,还没有开放视频识别功能。但如果我们回头看看,谁更容易做到这一点?答案显然是手机终端。所以,手机在执行我们的许多行为指令上有很大的潜力,而GPT-4o目前更多像是一个参谋或者顾问。我认为内容和行为是完全不同的两件事。
李楠:关于这个问题,我和两个斯坦福年轻人——“章鱼”的创始人聊过。他们通过蒸馏剪枝将端侧模型缩小到一B左右,在学习安卓12的API。他们确实担心能否学习iOS的API,苹果是否允许?我告诉他们:“不让你学的人,就是可能会被你打败的人。”
这样的情况在开源软件时代我们见过无数次。你可以帮助华为打败苹果,或者帮助安卓打败iOS,因为你能够提供比Siri更好的端侧AI体验,帮助执行任务。谁封闭,开源世界就会攻击谁。最后的结果输赢不定,但五五开是常见的结果,也许会被击败。就像今天的甲骨文,Oracle已经不再具有昔日的影响力。
图:Oracle
总结:AI技术的未来充满不确定性,成功与失败交织在一起。终端和AI的形态还在快速演变中,未来充满了未知与可能。
腾讯科技:目前很多新兴AI应用不断涌现,但成功的似乎微乎其微,两位怎么看待这个现象?
李楠:GPT4的革命自2023年3月开始,到现在2024年9月,才一年多时间。在这一年多的时间里,可能性是无限开放的。我们知道,在高度成熟的互联网行业后期,投资的胜率非常低,资本认为只有1%或更少的机会,今天可能还更低。因此,100个失败的AI应用案例是完全可能的,但不代表那千分之一的成功案例不存在。我们已经看到一些例子,比如Meta眼镜在不到12个月内卖出了200万副,它确实为用户提供了真正的价值。
王煜全:用历史去预测未来是非常困难的。当年互联网的BAT(百度、阿里巴巴、腾讯)出现之前,BBS(论坛)一度很流行,大家都在讨论,后来很多人说BBS会消亡,事实也证明如此。关键问题是,未来的BAT会是什么样子?我觉得在这方面的探索很少,讨论也不多。
我们常说任何新技术出来就像一辆坦克,但关键是如何打出“闪电战”。OpenAI的ChatGPT确实是个“坦克”,但它的“闪电战”是什么?我觉得现在还没找到。
唯一一个有一定规模的应用可能就是AI搜索,但它的形态现在和未来或许会有很大差异,还未定型,这正是它有趣的地方。因此,终端的很多形态,可能今天我们讨论的方向会与未来大不相同。
总结:未来智能终端的成功不仅依赖于性能的提升,更关键的是用户的实际使用体验。手机应用与互联网应用的差异,将决定未来的发展方向。
腾讯科技:两位如何看待未来“闪电战”的关键因素?
李楠:提到“闪电战”,iPhone的迅速崛起就是历史上著名的一次闪电战,它有一个销量的“金线”。我们认为,iPhone的实际销量应该超过了70万台,供应链订单超过140万台,所以任何未达到这条线的产品,我们认为都不算是一次新的革命原型。然而,Meta眼镜已经突破了200万副的销量。虽然我不敢断言它是否真的成功,但至少它达到了一个基本的标准线,展现出了一种类似“闪电战”的效果。我认为,未来手机厂商之间的竞争,模型的智能水平将是决定性的。
王煜全:我觉得我们现在看到的一切,未来可能并非如此。作为经历过无线互联网时代的一员,我当时也曾担任过移动的能源顾问。那个时代一开始大家都非常关注性能等技术指标,但后来我们知道,性能到了某个阶段,已经不再是限制因素。因此,这也是一种预测,不可能完全准确,但我们应该对性能的持续提升保持信心。
回到问题的核心,我认为未来的“闪电战”依然取决于用户的实际使用体验。当性能不再是瓶颈时,真正的障碍是用户的使用意愿。从这一角度看,手机终端是关键。事实上,我们现在刚刚迈出了第一步,我们讨论的主要是将现有的OpenAI业务从互联网转移到手机上,但忽略了手机与互联网是完全不同的。手机上的应用和互联网应用可能会有很大差别,而在这方面的研究还不够深入。
腾讯科技:接下来我们聊一下隐私安全性的问题,之前两位对这个话题有不同的观点:煜全很认可苹果的安全机制,而李楠对苹果的隐私保护持怀疑态度。今天我们可以展开聊聊。
图:Apple intelligence安全隐私
总结:隐私安全在技术发展中是无法避免的风险问题,但当技术带来的价值远超风险时,人们往往会选择继续使用。平台对数据的掌控,特别是像苹果这样的公司,可能在未来的竞争中占据领先地位。
李楠:我可以信任苹果,但我不信任OpenAI。我觉得马斯克说的是事实。用户隐私这个问题,实际上就是一个伪命题。苹果强调隐私保护,其实更多的是向用户表明态度,“我很在乎你,我是为你服务的。”所以我觉得听一听就好了。
王煜全:我觉得这事根本就不重要。归根结底,信任与否其实只有两个选择,不管你信任谁,都会有漏洞。到目前为止,我还没见过一个完全没有漏洞的系统。也许在未来,基于去中心化构建的集中计算平台能够解决这个问题。现在,很多人在研究联邦学习等技术,但距离实际应用还有很长的路要走。这不仅是技术问题,还涉及到平台能否成立、应用能否成功。在此之前,你只能选择使用这些集中化的平台提供的服务。
严格来说,这些平台都有漏洞,甚至在某些方面,西方人认为苹果的漏洞可能更大,特别是在中国,苹果还依赖云上贵州。所有这些都是隐患。如果你认为有问题,可以选择不用,但问题是,如果不用,你就会落后。所以大多数人还是选择使用这些技术。我们会发现,很多时候我们使用的技术并没有那么安全,但当技术发展到一定程度时,安全问题就逐渐被淡化了。所以我认为,只要达到一定的安全性标准,就应该去使用这些技术,因为它们带来的利益和价值远远超过了安全性带来的风险。
现在的问题是“权衡利弊,取其轻”。一方面是所谓的安全隐私,可能会有部分用户隐私被泄露;另一方面则是所有的隐私都被某个平台掌控,比如苹果。你会选择哪一边?我们之前讨论的“技术封建主义”危害更大,因为它让你没有翻盘的机会。这也是为什么我认为,苹果在下一轮竞争中可能会领先,它对用户数据的掌控过于强大。苹果可以不分享数据给其他人,但可以让自己的应用使用这些数据,这就像当年Internet Explorer是如何击败Netscape的一样。
总结:苹果在隐私保护和数据监管上的保守态度虽然维护了用户信任,但也可能限制了其在终端智能领域的发展潜力,尤其是涉及AI代理和API开放等关键技术。
腾讯科技:那么目前来看,如果我们想找到一家比苹果能更好地保护用户隐私的科技巨头,还会有谁?另外,苹果确实是一个消费品牌,很多时候它的动作是为了传播效果。至于它具体如何处理和使用这些数据,我们实际上并不知道。
王煜全:关键是,屠龙的少年有可能变成恶龙。当我保护得特别好,所有用户都涌向我时,我拥有了足够的话语权,你猜我会怎么做?
当然,坦白说,我也不认为苹果完全是在做传播。我认为现在尤其是在欧洲,数据监管越来越严格,苹果可能因为对数据监控的谨慎态度,推迟了许多新技术的推出。
比如在人工智能领域,大家都在谈论大模型,但我更关注的是AI代理(AI agents),它们能够帮助我完成任务。一个核心问题是,我能否调用其他API,甚至在手机上调用其他App。在互联网领域,API的核心就是能够调用其他应用程序。我认为,苹果之所以不开放这些功能,很可能是由于对隐私、监管以及可能面临罚款的恐惧。既然大家都没有开放这些功能,苹果也可能长期不开放,但这也意味着终端智能的功能性会因此受到很大限制。
总结:李楠认为安卓开源和市场多样性将推动技术的落地,即使苹果不开放也不会阻碍创新。王煜全则指出,无论是苹果还是安卓,底层功能不开放,跨App调用仍面临技术和监管的障碍,限制了真正的智能行为分析和应用。
李楠:那不会,安卓阵营是开源的。即使苹果不开放某些功能,我们可以通过技术demo来展示成果,最终由某些品牌落地,并获得市场成功。苹果手机的全球出货量只占14%,还有86%是其他品牌的手机,因此不会因为苹果不做某些功能而阻碍技术进步。
不同国家、市场和品牌中,总会有激进的品牌通过开源生态取得优势。我相信这些多样性会促使功能的实现。比如,章鱼正利用安卓开源代码的API进行训练。虽然有些App不开放接口,但我们仍可以通过其他手段实现功能,比如通过苹果的专利模拟GUI操作,或者利用网页URL调用功能。App生态虽然有限制,但这并不意味着需求无法被满足。
图:安卓VS苹果
王煜全:开源阵营也有相同的问题。即便是开源的安卓,如果它不允许你从底层调用其他App,你也无法实现跨App调用,没有开放到那个程度。很多底层功能如果苹果作为手机终端厂商不开放,第三方就无法调用。不仅仅是苹果,其他品牌也会面临相同的监管问题。因此,即使苹果手机只占14%的市场份额,其他品牌也会受到类似限制。最核心的问题是,现在手机终端是否能够实现像“帮我订餐”这样的智能操作。订餐需要第三方App开放数据来分析用户行为,而很多App不愿意开放这些数据。
虽然有其他方案,比如模拟操作界面或调用网页URL,但这些并不能真正解决调用App内部数据的核心问题。即使在技术上能够绕过一些限制,但平台不开放数据接口,无法实现深度的行为分析。手机对我的最大价值在于分析我的行为并做出决策,而这些行为数据现在并不开放。如果终端厂商不开放底层功能,即便有技术手段,也很难实现我所期待的智能操作。简单来说,你能设计一个应用监督我在手机里每次调用App的行为,知道我在微信里做了什么吗?
总结:未来需求挖掘的方式将超越App的限制,通过自然语言处理等技术获取用户行为数据,将成为新的方向。App不是唯一的解决方案,自然语言和新型数据采集方式将带来更深入的用户理解。
李楠:过去20年里,人的需求确实主要体现在App里的行为中,但Rewind的案例给我们带来了一些新的思考。Rewind的概念是通过一个挂坠记录你一天的所有声音,Plaud则是提供一个AI录音机,在需要的时候记录会议。这些应用告诉我们,虽然我们习惯了通过App进行行为表达,但人类的需求和欲望并不局限于App。我们有更自然、更根本的表达方式,不能因为用了20年App就认定它是唯一的解决方案。
App并不是最优解,也不可能是。如果App不开放,那我们可以不使用它,这并不意味着我们无法发现需求或解决问题。Plaud可以记录你的会议,Rewind的目标是记录你一天的音频,未来或许还会有记录视觉信息的技术。当我们拥有这些数据时,我们将能够更深入地了解用户,即使不完全知道他们在App里的具体行为。
自然语言处理能力能够主动发起对话,甚至可以直接询问用户的需求,而这正是App所不具备的能力。因此,未来会有全新的方式来挖掘需求。这些数据将具有极高的价值,但它们并不一定来源于App的操作行为。虽然App里的数据很有价值,但我对所有App是否能真正利用这些数据并进行AI化持怀疑态度。
然而,这也带来了另一种可能性。比如我们正在与钉钉合作,钉钉的创始人跟我很熟,他们正在尝试一个新方向——通过AI对App行为数据进行训练,然后利用这个AI来服务用户。当App能够理解自然语言并调用其内部功能时,它就可以与其他App进行对话。因此,未来即使我们不了解所有App的内部行为数据,也可以通过自然语言来获取信息,比如“这位用户每天大概几点开会”。
而且在8个月内,我相信你会看到这样的场景。
总结:未来手机将超越当前的功能,成为智能顾问般的工具,帮助用户快速解决问题并进行分析。小公司虽然具备技术能力,但用户更信任大公司如谷歌和苹果,因为它们能确保数据安全并提供稳定的服务。手机和人工智能的结合将彻底改变我们与设备的交互方式。
王煜全:刚才提到的都是正确的,比如你可以用AI工具记录视频、分析App并执行操作,无论是来自大公司还是小公司,这些技术都可以实现。但问题在于,你会相信一个小公司吗?回想一下,当年安卓是如何崛起的。当时有很多人做手机操作系统,但最终成功的是安卓,因为它背后有谷歌支持。谷歌承诺不收费,长期维护系统,大家信任它。而小公司即使技术再好,也难以赢得用户的信任。手机是非常私密的设备,用户希望自己的手机能够保障安全。
其次,操作系统如果开放API,肯定会有监管。大公司能够确保安全,而让第三方持续记录你的行为,这实际上是非常困难的。因此,我们讨论基于几个基本点。首先,我认为手机正在超越当前的基本功能,不再仅仅是用于通讯和娱乐,未来它会承担更多任务。举个例子,我经常需要进行研究,过去我会打开电脑,通过谷歌进行搜索,再整理信息。现在,我已经习惯了使用GPT-4o,手机上有语音互动功能,我随时可以通过语音向GPT-4o提问,比如“这个问题你怎么看?”或“帮我整理一下资料”。它马上就能给出答案,极大地加快了我的研究效率。
目前唯一的问题是,手机上的整理结果还需要导入电脑,但我相信,未来苹果等公司很快会意识到这一点,可能直接在电脑上实现这一功能。人工智能的加入让我的研究过程快了一大步,感觉就像有一个强大的顾问随时在旁协助我。它背后有强大的数据库,能快速提供所需的分析和结论。
因此,随着人工智能的发展,手机的使用方式将与过去完全不同。如果我们仅从现有手机的角度去解决问题,那就没有真正理解未来手机的潜力和用途。
总结:超级App之间短期内不可能打通数据,但随着App的AI化和大模型的发展,未来App之间通过自然语言进行交流或许会实现数据互通。
不过,短期内竞争仍主要集中在巨头之间,去中心化的真正实现可能还很遥远。
腾讯科技 郑可君:另一个问题,以后各个App之间会愿意打通数据吗?还是说它们更像互相隔着一个防盗门在隔空喊话,但是把数据还锁在自己这。我很难想象这个情景是什么样子的。
图:App Store
李楠:不用想,肯定不会打通。苹果的数据属于苹果,钉钉的数据属于钉钉。App生态本身就是个问题,而App这种形态未来必然会面临挑战。不过,很多App正在走向AI化,像Notion这样的应用已经在朝这个方向发展。
未来,App有可能通过AI互相对话,比如Midjourney和Notion可以通过自然语言交流,这样用户就不需要再费力输入复杂的提示词了。如果所有App都能理解自然语言并生成语言,那它们之间为什么不能对话?一旦实现对话,数据就相当于打通了。我觉得8个月内我们可能就能看到类似的应用出现。
王煜全:其实并不难想象,各大平台都基于大模型运行,大模型之间已经有了统一的交流语言——token。一个平台输入token,输出token,另一个平台同样也是如此,理论上它们是可以对话的。但问题在于,标准必须足够统一。
OpenAI的平台本身很有潜力,比如之前的GPT Store,但它的管理经验明显不如App Store。GPT Store只是简单陈列应用,而App Store开放了很多端口。虽然去中心化的App互通未来可能会实现,但我认为短期内仍然是巨头之间的竞争。大模型在应用层面可能带来新的统一标准,这或许是未来的方向。
总结:短期来看,未来手机将作为管理中心连接各种设备,人工智能的核心是通过规模化提供高端服务,类似于福特通过规模化生产普及汽车。硬件和软件的价值在于有效传递这些服务,而非仅作为简单的工具存在。
腾讯科技:手机之后会是AI与物理世界交互的最佳硬件吗?下一代的产品范式会是什么?
图:Meta智能眼镜
王煜全:关于手机之后的硬件形态,其实很早就开始讨论了。虽然智能时代才刚刚到来,但手机的功能早在之前就已被广泛研究。当时有个流行的概念叫PDA(Personal Digital Assistant,个人数字助理),但我们提出,手机的定位应该更高,叫“个人智能助理”(Personal Intelligent Assistant, PIA),因为它的算力远超传统的数字助理。即便到了今天,这个定义依然适用,手机依然是非常强大的设备。
我们还提到了“身体局域网”(Body Area Network)的概念,它是指耳机、手表、笔记本电脑等设备通过手机组成的网络。尽管耳机和手表的算力较弱,但它们通过手机这个中心设备进行数据处理和传输。未来,手机可能不再是主要的交互界面,而是管理和处理其他设备的后台中心。交互界面可能会是VR设备或其他外设。虽然我们携带的设备越来越多样化,但手机作为“个人智能助理”依然是核心。
在进一步探讨未来时,人工智能带来的核心能力与工业革命非常相似。工业革命的核心能力是规模化生产复杂产品,如汽车,而智能革命则是规模化提供服务。以前很多服务只能通过人来提供,但现在人工智能已经可以实现。硬件和软件的价值在于它们传递服务,满足用户需求。如果硬件和软件不能有效传递这些服务,它们的存在就失去了意义。
以福特汽车为例,1908年福特开始大规模生产汽车,售价仅为950美元,折合今天的价格也不到1万美元。而特斯拉今天还没有能达到这一价格的车。当时福特通过规模化生产降低了制造成本,让汽车变得更加普及。类似地,今天我们追求的目标是通过人工智能规模化提供高端且稀缺的服务,以满足大众需求。曾经只有人才能提供的服务,现在人工智能也可以做到。而硬件和软件只是这些服务的载体,技术进步是为了更好地传递这些服务。
总结:预测未来尤其是在科技领域极其困难,甚至乔布斯也无法完全看清。关键在于行动,不断尝试,并在短期内保持灵活性,而不是试图掌控长期未来。
李楠:我见过很多硬件行业的人,他们试图预测未来,用产品去赌。通常一次失败就会损失一个亿人民币,这还只是少数情况。
事实证明,地球上可能没有人能够看清超过12个月的未来,因为我见过太多中国大佬们栽跟头。
我曾看过一个有趣的访谈,早期的PDA和智能手机制造商的老板谈到过他和乔布斯的一次会议。当时他们造不出高质量的智能手机,于是去找苹果商谈。乔布斯在会议中间画了一个MacBook的图,然后把各种设备,如音箱、手机等,围绕在它周围。乔布斯说,“你看,你的手机可以加入到这个圈的外围。”但另一人说道,“你错了,手机应该是这个圈的中心。”这个故事告诉我们一个很重要的道理:乔布斯这样的天才在移动互联网变革的早期阶段也未必能看清未来。
所以,今天如果有人说他可以确定手机依然是未来的中心,这种预言有点超出人的能力范围。不过,我相信现在确实有动摇手机中心地位的机会。
因此,最重要的不是去预测未来,而是在不让自己失败的前提下多做尝试。或许某个项目在6个月内能赚1.6亿人民币,就像Meta眼镜已经突破了iPhone的销量金线一样。我们应该专注于行动、发布产品,而不是过度预测未来。能看清12个月的人,几乎是神了。能在6个月内不把自己玩死,就已经很不错了。
总结:从工业设计的角度,iPhone 16通过4K 120Hz视频拍摄等功能强化了摄影能力,符合当今视频时代的需求。增加拍摄按键体现了“软件定义硬件”,提升了用户体验。
腾讯科技:苹果这次发布会上新增了一个控制按键,可以直接使用视觉搜索功能。你们认为这是合理的交互设计吗?为什么在Siri已经可以快捷唤醒的情况下,苹果还要加入这种看起来传统的硬件设计?
李楠:从乔布斯的设计风格来看,他宁愿去掉所有的按键。我曾参与过一个获得IF金奖的产品,我们也尽量减少按键设计。
然而,这次苹果反其道而行之,增加了按键。但我不认为这个设计完全没有道理。从工业设计的角度看,iPhone 16的最重要升级是4K 120Hz的视频拍摄、实时调整和混音功能。这些增强功能显然是为了强化iPhone在摄影和高质量视频输出上的能力,这正符合当今TVC和Vlog时代的需求。因此,软件如此强大地加强了这些功能,为此增加一个拍摄按键,让用户更舒适地使用这些功能,是合理的。这是“软件定义硬件”的体现,为用户提供了实际的价值。
至于它是否与Vision Pro有关系,我个人认为没有太大关联。也许苹果想把它们关联起来,但在我看来,这只是苹果的一厢情愿。我不觉得Vision Pro有什么实质性的成功,无论从哪个维度看,这款产品都已经失败。没有任何证据能证明它的成功,我作为20年的苹果用户都无法证明它的成功。
腾讯科技:或许Vision Pro还在迭代中,未来它的续航和重量可能会改善,如果这些问题解决了,将会有更广泛的应用。
李楠:你说的有道理,但这需要苹果展示出“做减法”的能力。我同意未来可能会有改进,但现在看,苹果在很多产品上并没有展现出足够的减法能力。
总结:新按键的意义取决于苹果是否有更深层的计划,如果它能启动智能助理功能,按键就有价值。
王煜全:我觉得关键在于苹果的下一步动作,目前它的真实意图还不清楚。
它在大谈Apple Intelligence的同时,展示的应用却显得很小儿科。所以我怀疑是否有后续计划,如果没有后续,这个按键就没有意义;但如果有后续,这个按键可能就有用。
理论上讲,增加一个按键意味着这个功能会被频繁使用。如果这个按键只是为了摄像,我觉得不应该这么设计,但如果是为了实现视觉智能,比如按下这个键,摄像头不仅打开,还能实时识别物体并启动对话支持,那这个按键就有意义。尤其是如果它能启动一个强大的智能助理功能,那这个按键就变成了助理键,这样的设计是有价值的。
腾讯科技:它的多模态功能或许不仅限于拍摄,我想象中的多模态应该是更全面的,不只是按下按钮在框内识别物体,而是像一个随时陪伴在你身边的朋友,甚至不需要唤醒词,只要带着手机,随时就能互动。
王煜全:我觉得它还是需要有唤醒机制,随时随地记录你会让人害怕。必须要有一个唤醒信号,让用户明确知道自己启动了互动,并默许设备记录状态。虽然用户可能实际上没有对信息的真正掌控权,但对监管者必须表现出用户拥有控制权的样子。
腾讯科技:如果苹果要实现“万物皆AI”,从终端产品、芯片到软硬件结合的生态系统来看,还有哪些难关需要攻克?哪些是现在需要解决的,哪些是未来需要解决的?
总结:苹果丧失了激发用户情感的能力,作为消费品牌,它丧失了“One more thing”和“Think different”的能力这可能是它面临的更大难关。
李楠:苹果在未来面临的一个明确难关是它与高通的竞争。苹果一直在开发自己的通讯基带,并尝试将其整合到SOC中,虽然不清楚在AI时代是否会改变这一目标,但它已经在这个领域努力了很多年。在中国,很多用户经常吐槽苹果手机的信号问题,这个基带问题确实是苹果多年必须克服的难题。
除了通讯基带,苹果在端侧模型的技术上还有很大的潜力。苹果有强大的芯片设计能力,能够在硬件层面为端侧模型提供更多支持。我们已经在A18芯片上看到了它在这方面的改进,未来iPhone的端侧模型能力会变得越来越强。
但我认为苹果面临的另一个更大的问题是,它已经失去了让消费者感到激动的能力。这个问题比技术难题更大。如今的苹果不再像过去那样能驱动消费者的情感,甚至连发布新产品都不能让用户激动。举个例子,我今天看到华为的三折叠手机,感觉比苹果的发布会更让我激动。
苹果已经丧失了“one more thing”和“think different”的能力,作为一个消费品牌,它已经不再能引发用户情感的共鸣。这是一个比技术挑战更严重的问题,尤其是在消费领域,购物车添加行为是理性驱动的,但用户在最终付款时是感性驱动的。
真正的算力革命发生的时刻,苹果最应该找回来的是当年的“Think different。”
总结:技术革命的核心在于观念的突破,而苹果当前的Apple Intelligence只是对现有服务的提升,缺乏真正的创新。
王煜全:说实话,最大的难关是观念问题。历次技术革命的真正引领者往往是观念的革命者。当年苹果通过iPod彻底颠覆了音乐产业,因为他们根本没把自己当作一个硬件公司。后来iPhone的发布,我印象特别深,乔布斯第一次演讲时说,这是iPod、internet navigator和phone的结合。这种观念上的升级充分展现了苹果的技术优势。
但现在来看,Apple Intelligence更多的是为苹果的现有服务进行升级,而不是从根本上推动技术革命。我认为这是一个巨大的局限。它还是围绕着如何通过智能技术提升苹果现有的服务,而不是思考如何利用苹果的硬件来支持更广泛的智能化需求。关键的问题应该是,人工智能如何真正帮助人们解决问题,而不是单纯为了提升摄像头等功能。
软件和硬件都应该为用户需求服务。现在的问题是,苹果并没有展示出真正的新突破。就拿摄像头为例,如果摄像头能够成为一个契机,扩展手机的功能,那是正确的方向。但如果只是让Apple Intelligence来帮助摄像头,那就是走错了方向。所以,目前来看,苹果喊了很久的“革命”并没有真正展现出革命性的表现。
文章来自于“腾讯科技”,作者“涵清”。
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。
项目地址:https://github.com/InternLM/MindSearch
在线使用:https://mindsearch.openxlab.org.cn/
【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。
项目地址:https://github.com/miurla/morphic/tree/main
在线使用:https://www.morphic.sh/
【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。
在线使用:https://ffa.chat/
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales