# 热门搜索 #
搜索
苹果卷入大模型,手机行业借AGI「吃掉」软件层?
6717点击    2024-06-14 11:37

股价一天大涨7%的苹果,终将干掉其他互联网巨头?


苹果重新定义了AI(Apple Intelligence)。


6月11日凌晨1点,苹果公司召开了今年的开发者大会WWDC,用了首场发布会将近一半的篇幅来讲AI如何整合到苹果系统中,将人工智能化于无形,融进Apple Intelligence。


媒体和资本评价两极化,一部分认为苹果这次出手,软硬件结合,在系统层面提供了AI能力,一夜之间灭了许多AI创业者的生路——毕竟在当下的节点,利用OpenAI 接口包装一个翻译插件或者脑图都算是创业,这可叫AI公司怎么活。


反方则认为苹果此次更新了无新意,原地雕花,不够炸裂,新功能还是基本集中在「文生图」、「文本总结」、「跨应用联动」这些老生常谈的功能上。从发布会后的股价上涨近7.26% 的表现来看,资本市场倒是对「苹果AI」基本满意。


无论Apple Intelligence有多么诱人 华丽,也只是苹果提前画的大饼,英文版今年秋天上线,其他语言要到明年才会有后续。半年时间,对AI公司来说可以做很多事。会有其他竞争者对苹果的蓝图提出挑战吗?



01 科技公司全面卷入AI


AI浪潮以来,美股七雄(Magnificent 7,即美国市场上市值最大的七家科技公司,包括Alphabet、亚马逊、苹果、Meta、微软、英伟达和特斯拉)分化明显,市值排序跌宕起伏。


在6月5日大涨后,「卖铲子」的NVIDIA市值超3万亿美元,超越苹果,距离3.15万亿的微软只需再涨不到5%;微软借AI登上第一,乘了OpenAI的东风,并乘势建立了更好的工具和商用系统,推出了AI-PC,23年营收达到惊人的2210亿美元;Meta用开源大模型造福了一票国内公司,用AI改进广告,内容审核和个性化推荐,利润翻了两番;亚马逊将AI整合到AWS框架中,意在企业级AI,它还投资了Anthropic,与NVIDIA合作Blackwell Gpu;Alphabet对标OpenAI节奏,但总感觉失之毫厘,略有涨幅;特斯拉掉队,苹果踟蹰不前,还在画饼。


大模型方面,科技公司都有fomo(fear of missing out)效应,人无我有,就很尴尬;产品和生态上,后发制人有优势。非盈利机构OpenaAI是最大造浪机,苹果与其合作,水到渠成。


苹果放弃造车后,一门心思钻研AI更广泛的应用,思路与其他 6 家不同,提出个人化AI(Personal),区别于微软的工具性AI(Azure/Microsoft365/Copilot),用尽生态优势,更重视操作的「非AI感」,理解用户身处的情境,和用户的生活交融,强调隐私保护。



苹果发布会上演示的例子是去机场接妈妈,Apple Intelligence可直接读取妈妈发来的航班信息,查询航班延误情况和机场交通,直接生成行动时间表并更新在日程中,本身要花好几分钟安排的事现在可以自动完成了。与siri类似,是生活工作小助手的定位,但更强大。


语言界面替代了操作界面,Apple版AI更理解人的需求和语言意味,而非仅仅在数值上更聪明,跑分更高。这是在让AI对齐人类生活方式,取巧,但又十分合理。


据「新皮层」报道,Apple Intelligence的模型架构主要由3部分组成,按调用的优先级,分别是自研的端侧模型、云端模型和GPT-4o等第三方模型。其中自研模型是苹果发布的一系列小型模型,包括可以读懂iPhone屏幕的多模态理解模型ReALM(Reference Resolution As Language Modeling),OpenELM(开源高效语言模型)等。苹果的模型能力不及OpenAI,是苹果选择接入第三方模型的原因。第三方模型可能不止GPT-4o。《华尔街日报》也曾于3月报道称,苹果还曾与百度初步谈判,以在其中国版设备(比如 iPhone)中使用后者的AI技术。苹果从未证实这一传闻。


这么看来,Apple Intelligence更像是多种模型组装的工具包,各司其职,各尽其用。AI在苹果生态里,与其说是对话唱歌画图的小软件,不如说是帮人完成一系列复杂操作的AI-Agent,它联通各平台设备,粘合使用体验——肯定有一部分是以智能家居的那种方式,另一部分就可以展开想象。


当然,AI的聚合、融合,还是依靠AI公司、资本、政府的高期望。对很多人来说,这个期望的化身,就是AGI。



如果把实现AGI当作最终目标,当下AI处在大投入大基建的状态:投算力、投新型的数据中心、投模型,三类投资分别对应的是生产GPU+ 卖GPU的云 + 用GPU训练模型的公司,也就是英伟达、AWS+Azure和OpenAI等大模型公司。苹果算是其中的异类,既不开发新模型,甚至也没有推出新应用,只是整合。


但AGI的实现还很遥远。造富路上,AI公司开始破产、倒闭、求收购。


2024年第二季度还没有结束,曾经有10亿美元估值、180名员工、创造出Stable Diffusion系列模型的明星独角兽 Stability AI,就出现资金链断裂,寻求合并。前OpenAI和谷歌AI开发人员创立的AI公司Adept,也在谈判售价。在「洗牌期」,就算有足够资金支撑下去的AI公司,都开始了裁员和降本增效。


这些现象暴露出残酷的行业现状:包括巨头在内,所有AI公司/项目都盈利困难。连OpenAI也只能靠不断融资来支撑ChatGPT高昂的运行成本。「摸着 OpenAI过河」,将订阅模式和企业版模式作为行业统一标准的其他玩家,只会更艰难。Meta为AI建设增加了约100亿美元预算,但未来几年内依然不指望盈利。


据行研机构PitchBook 数据,AI创企在2021-2023年获得了约3300亿美元投资,同比增长2/3,但很多AI创企的钱仍不够花,高昂的AI建设成本、人工成本已经拖垮不少AI公司。


国内风景独好,炼制大模型的巨头无忧生存,却因竞争激烈,打起了价格战。5月6日深度求索(DeepSeek)发布的DeepSeek v2,提供的API定价仅为GPT-4-Turbo的近百分之一,之后智谱、字节、阿里、百度、科大讯飞和腾讯都纷纷下调了部分大模型的API价格。


考虑到国内大模型,大部分是针对企业用户和特定行业,也许是性能评测标准不够刺激,也可能是大模型落地难,性能遇到了瓶颈,只能同质化竞争,价格战成了国内大模型行业问题的缩影和最终解决方式。


国内的AI公司和产品,长时间对标OpenAI,希望自家养的AI在跑分、推理、表现都超过GPT系列,是否做到暂且不谈,但其中有一些误区。AI不同于搜索引擎、平台入口、内容站,它的技术性远高于后者,在实际进入应用领域前,是纯粹科学和技术的事,也是纯投入的事业。


国内环境,人们对于AI的实质和AI的真正用途之间,有一道「理解鸿沟」,这首先是大模型的黑箱性质所造成的,但同时,国内的AI产品,无论是豆包、元宝、Kimi,还是激进地投入整条赛道的阿里做出来的东西,目前所呈现出来的能力,很难让用户持续买单,更别说让企业级用户认同。毕竟GPT-4o和Midjourney早已设立了标准。


苹果AI的确为国内市场打开了一条思路:跑分再高也只是抽象能力,自研模型够用就好,多模型融合,多层级协同,让AI上手做事,融入整体应用环境才是正经事。


从理论上来说,AI可以与迄今为止人类制造的所有软件、系统、数据库、云、电子设备结合,并产生新的交互模式。AI掌握了搜索引擎的使用方法和用户需求,就诞生了新的流量和内容入口,搜索就变成了AI的子功能,以前的计算广告投放模式会受影响。


AI吞噬一切,重新安排其重要性。


是时候拥抱新世界,做些新东西。总比苹果做好一切,国内再模仿来得强。AI 时代与流量时代完全不同,起码「模仿式创新」一定会变难。


02 AI改变个人工作流,但尚未改变行业


生成式AI的冲击改变了科技行业的轨迹,但普通人视角下,冲击在ChatGPT发布之后就逐渐放缓。


文字工作者(比如我)和广义的内容创作者们,早已全面拥抱AI。尽管AI很难写出80分的作品,但它可以高效满足创作者工作流中的离散需求:快速生产大纲、和用户一起头脑风暴、模仿文风、文本修改、长文本翻译、文字 - 语音互转、信息获取、数据整理、梳理财报等等,这些方面AI又快又好。


在艺术、影视、教育、人文学术圈,AI颇受欢迎,它提供了快速试错过筛的工具,加上自身也是卖点和噱头,AI成了一种隐喻修辞,代表着机遇,以及危机感。



任何研讨会加个「AI时代」的名头都能多吸引点注意力和流量。


这一波生成式AI的发展可能会经历四个阶段:惊艳的玩具,(多样化且具备替代效应的)生产力工具,个人化系统,(具有网络效应)的生态系统。


目前的产品大多在从第一阶段到第二阶段过渡。


大部分AI产品,包括国外的,长期用下来,除了内嵌在应用和网页中的AI和特定用途AI以外(比如wiki AI,notion AI,memo AI,Perplexity),大多还是花里胡哨,重复造轮子居多。


AI在当下,尝鲜多于工作,助力于个人多于组织,它只改变了游戏的乐趣,并未改变游戏规则,犹如个人写东西用Word 还是Ulysses,只有体验的细微区别,无关乎生产力。工具需的组织化、社会化、网络化,才能最大化效能(比如微信和github)。


回到产业,AI尚未颠覆任何领域,干掉任何公司——除了做二次开发(套壳)的公司,在每次OpenAI发布新产品时都哀叹不已。行业替代性在客服、审核等岗位的确存在,只是尚未爆发,因为AI还未先进到重塑流程。


与互联网浪潮不同,大模型时代也许不需要Killerapp,无论AI多么强大,整体提升Workflow,提供端到端的输出,都比较难。这些流程依赖于长程推理、常识和行业Know-how,光靠语义链接的桥梁还远远不够。


大模型作为一个概率模型,在低容错率场景时仍然面临很多问题,远没有我们想的那么神奇:我在写这篇文章时,让GPT-4o查询NVIDIA近年股票和市值变化,一个看似简单的问题,它需要现将问题拆分成步骤,然后分别去搜相应的信息,再做一个总结,最后居然还是错的,还不如直接用搜索引擎快。


此外,很多定制化的工作,可能90%的文档都不能满足大模型Embedding时的质量要求,还要做大量的数据清洗才能用。大模型的注意力也不够稳定,经常被不相关的问题干扰,出现幻觉。



大模型的产品发展与互联网的产品发展还有一个截然不同的地方:边际成本非常高,模型成本要远远高于人力成本和买量成本。移动互联网时代的App可以在小步快跑式迭代,但基于底层大模型+开源小模型的鸡尾酒分层打法的App尚未找到类似路径。也因此,还未出现大公司被小公司弯道超车的可能性。


当然,假以时日,AI也许能在软件编写上有所建树。纽约市的风险投资基金Pace Capital的创始合伙人Chris Paik在「软件的终结」(The End of Software)一文里提出,大模型不一定会颠覆toC产品,但有可能颠覆软件生产,因为软件的成本在于开发人员,他们将人类语言翻译成计算机语言,大模型也许比人更擅长做这事,形成液态系统,建立中间层,链接一切。


「代码将变得灵活可塑,传统的技术栈概念将逐渐消失,取而代之的是由 AI 生成的微服务的流动海洋,这些微服务可以根据需要进行重新组合和再构」。


苹果说:我也是这样想的。


03 如果没有AGI,你还会期待AI吗?


不要太期待AGI。


在业界狂热讨论AGI何年达成之时,学界泼了三盆冷水。图灵奖得主、Meta首席AI科学家杨立昆(Yann Lecun)就并不认可AGI,他认为根本不存在通用智能,且大模型也不可能通向AGI。他还在X上说,「如果你是一名对构建下一代人工智能系统感兴趣的学生,不要研究大型语言模型(LLMs)」。


杨立昆并非唯一反对AGI的人。李飞飞从另一个角度论证了类似观点,她认为无论大模型有多少参数,AI都无法拥有「知觉」,即所有的感觉——饥饿、疼痛、坠入爱河,因此AI不可能拥有主观体验的能力,甚至不可能接近人类智能。


李飞飞曾经的老师,香港大学马毅认为,当前的生成AI其能力依靠规模定律(Scaling Laws)涌现其能力,但规模定律并非物理定律,而是一种偶然,早晚会失效,AI又不是只有喂数据堆参数这一种造法。


马毅在接受《晚点》采访时说,「如果你的信仰就是Scaling Laws,觉得把现在的系统做大就能实现AGI,我觉得你该改行了。因为你已经不可能有作为了,你就只能做一个螺丝钉」。大模型是有极限的,随着语料库耗尽,Scaling Law 失效,以及算力和电力几何级数增加,内部黑箱无法破解,也许有一天,生成式AI的发展出现停滞,不是不可能。


我想起,在AlphaGo/Zero大展威力的时代,人们对AI的能力感到格外惊奇和恐惧,代表人类最强棋手的李世石最后输给AI,似乎为碳基生命的命运写下最后注脚。


但从现在回看,并没有那么悲凉。


当时,我偶然和人工智能早期先驱、《GEB》作者侯世达(Douglas Hofstadter)见过一面,我问他,你觉得Alphago是否实现了某种意义上的「智能」?他说,非也,即使Alphago战胜了人类,但相比于人类,AI还是太简单,如同缸中之脑,对现实一无所知。他确信深度学习无法抵达智能,但可以很好地解决一些问题。


Sora出现时,人们讨论它是否理解物理世界(尽管它内置了牛顿定律),物理主义者可能会认为 AI= 大脑 = 智能 = 有无限潜力的理解工具,但拥有常识的人则会认为这是错误的问题。


如果没有AI,AI前进的动力和目标在哪里?


OpenAI联合创始人Greg Brockman有一个很好的比喻,人工智能被「烘焙」进了经济之中。意思是,如何部署 AI,需要融入其他「原料」混合,它们以不同的方式运作,等待一段时间后,开始发挥作用。从消费者的角度来看,与 ChatGPT的对话只是调用一次API,就如同访问一次网站,下载一部电影。随着技术进化,公司把AI做细,AI融入软件之间、用户界面以及无数中间层,功能变得越来越细微,用户就会习惯AI。


Apple对AI深度整合,即使平庸,至少可用。在未来,也许AI能服务每个人的日常生活,最后,你无需感受到AI的存在。大模型还没有诞生杀手级应用,但手机形态可能会比大多软件商活得更久,这是2024WWDC能隐约看到的图景。


本文来自微信公众号“周天财经”(ID:techfinsight),作者:向辉


AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/

4
免费使用GPT-4o

【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。

在线使用:https://ffa.chat/