ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
苹果卷入大模型,手机行业借AGI「吃掉」软件层?
6836点击    2024-06-14 11:37

股价一天大涨7%的苹果,终将干掉其他互联网巨头?


苹果重新定义了AI(Apple Intelligence)。


6月11日凌晨1点,苹果公司召开了今年的开发者大会WWDC,用了首场发布会将近一半的篇幅来讲AI如何整合到苹果系统中,将人工智能化于无形,融进Apple Intelligence。


媒体和资本评价两极化,一部分认为苹果这次出手,软硬件结合,在系统层面提供了AI能力,一夜之间灭了许多AI创业者的生路——毕竟在当下的节点,利用OpenAI 接口包装一个翻译插件或者脑图都算是创业,这可叫AI公司怎么活。


反方则认为苹果此次更新了无新意,原地雕花,不够炸裂,新功能还是基本集中在「文生图」、「文本总结」、「跨应用联动」这些老生常谈的功能上。从发布会后的股价上涨近7.26% 的表现来看,资本市场倒是对「苹果AI」基本满意。


无论Apple Intelligence有多么诱人 华丽,也只是苹果提前画的大饼,英文版今年秋天上线,其他语言要到明年才会有后续。半年时间,对AI公司来说可以做很多事。会有其他竞争者对苹果的蓝图提出挑战吗?



01 科技公司全面卷入AI


AI浪潮以来,美股七雄(Magnificent 7,即美国市场上市值最大的七家科技公司,包括Alphabet、亚马逊、苹果、Meta、微软、英伟达和特斯拉)分化明显,市值排序跌宕起伏。


在6月5日大涨后,「卖铲子」的NVIDIA市值超3万亿美元,超越苹果,距离3.15万亿的微软只需再涨不到5%;微软借AI登上第一,乘了OpenAI的东风,并乘势建立了更好的工具和商用系统,推出了AI-PC,23年营收达到惊人的2210亿美元;Meta用开源大模型造福了一票国内公司,用AI改进广告,内容审核和个性化推荐,利润翻了两番;亚马逊将AI整合到AWS框架中,意在企业级AI,它还投资了Anthropic,与NVIDIA合作Blackwell Gpu;Alphabet对标OpenAI节奏,但总感觉失之毫厘,略有涨幅;特斯拉掉队,苹果踟蹰不前,还在画饼。


大模型方面,科技公司都有fomo(fear of missing out)效应,人无我有,就很尴尬;产品和生态上,后发制人有优势。非盈利机构OpenaAI是最大造浪机,苹果与其合作,水到渠成。


苹果放弃造车后,一门心思钻研AI更广泛的应用,思路与其他 6 家不同,提出个人化AI(Personal),区别于微软的工具性AI(Azure/Microsoft365/Copilot),用尽生态优势,更重视操作的「非AI感」,理解用户身处的情境,和用户的生活交融,强调隐私保护。



苹果发布会上演示的例子是去机场接妈妈,Apple Intelligence可直接读取妈妈发来的航班信息,查询航班延误情况和机场交通,直接生成行动时间表并更新在日程中,本身要花好几分钟安排的事现在可以自动完成了。与siri类似,是生活工作小助手的定位,但更强大。


语言界面替代了操作界面,Apple版AI更理解人的需求和语言意味,而非仅仅在数值上更聪明,跑分更高。这是在让AI对齐人类生活方式,取巧,但又十分合理。


据「新皮层」报道,Apple Intelligence的模型架构主要由3部分组成,按调用的优先级,分别是自研的端侧模型、云端模型和GPT-4o等第三方模型。其中自研模型是苹果发布的一系列小型模型,包括可以读懂iPhone屏幕的多模态理解模型ReALM(Reference Resolution As Language Modeling),OpenELM(开源高效语言模型)等。苹果的模型能力不及OpenAI,是苹果选择接入第三方模型的原因。第三方模型可能不止GPT-4o。《华尔街日报》也曾于3月报道称,苹果还曾与百度初步谈判,以在其中国版设备(比如 iPhone)中使用后者的AI技术。苹果从未证实这一传闻。


这么看来,Apple Intelligence更像是多种模型组装的工具包,各司其职,各尽其用。AI在苹果生态里,与其说是对话唱歌画图的小软件,不如说是帮人完成一系列复杂操作的AI-Agent,它联通各平台设备,粘合使用体验——肯定有一部分是以智能家居的那种方式,另一部分就可以展开想象。


当然,AI的聚合、融合,还是依靠AI公司、资本、政府的高期望。对很多人来说,这个期望的化身,就是AGI。



如果把实现AGI当作最终目标,当下AI处在大投入大基建的状态:投算力、投新型的数据中心、投模型,三类投资分别对应的是生产GPU+ 卖GPU的云 + 用GPU训练模型的公司,也就是英伟达、AWS+Azure和OpenAI等大模型公司。苹果算是其中的异类,既不开发新模型,甚至也没有推出新应用,只是整合。


但AGI的实现还很遥远。造富路上,AI公司开始破产、倒闭、求收购。


2024年第二季度还没有结束,曾经有10亿美元估值、180名员工、创造出Stable Diffusion系列模型的明星独角兽 Stability AI,就出现资金链断裂,寻求合并。前OpenAI和谷歌AI开发人员创立的AI公司Adept,也在谈判售价。在「洗牌期」,就算有足够资金支撑下去的AI公司,都开始了裁员和降本增效。


这些现象暴露出残酷的行业现状:包括巨头在内,所有AI公司/项目都盈利困难。连OpenAI也只能靠不断融资来支撑ChatGPT高昂的运行成本。「摸着 OpenAI过河」,将订阅模式和企业版模式作为行业统一标准的其他玩家,只会更艰难。Meta为AI建设增加了约100亿美元预算,但未来几年内依然不指望盈利。


据行研机构PitchBook 数据,AI创企在2021-2023年获得了约3300亿美元投资,同比增长2/3,但很多AI创企的钱仍不够花,高昂的AI建设成本、人工成本已经拖垮不少AI公司。


国内风景独好,炼制大模型的巨头无忧生存,却因竞争激烈,打起了价格战。5月6日深度求索(DeepSeek)发布的DeepSeek v2,提供的API定价仅为GPT-4-Turbo的近百分之一,之后智谱、字节、阿里、百度、科大讯飞和腾讯都纷纷下调了部分大模型的API价格。


考虑到国内大模型,大部分是针对企业用户和特定行业,也许是性能评测标准不够刺激,也可能是大模型落地难,性能遇到了瓶颈,只能同质化竞争,价格战成了国内大模型行业问题的缩影和最终解决方式。


国内的AI公司和产品,长时间对标OpenAI,希望自家养的AI在跑分、推理、表现都超过GPT系列,是否做到暂且不谈,但其中有一些误区。AI不同于搜索引擎、平台入口、内容站,它的技术性远高于后者,在实际进入应用领域前,是纯粹科学和技术的事,也是纯投入的事业。


国内环境,人们对于AI的实质和AI的真正用途之间,有一道「理解鸿沟」,这首先是大模型的黑箱性质所造成的,但同时,国内的AI产品,无论是豆包、元宝、Kimi,还是激进地投入整条赛道的阿里做出来的东西,目前所呈现出来的能力,很难让用户持续买单,更别说让企业级用户认同。毕竟GPT-4o和Midjourney早已设立了标准。


苹果AI的确为国内市场打开了一条思路:跑分再高也只是抽象能力,自研模型够用就好,多模型融合,多层级协同,让AI上手做事,融入整体应用环境才是正经事。


从理论上来说,AI可以与迄今为止人类制造的所有软件、系统、数据库、云、电子设备结合,并产生新的交互模式。AI掌握了搜索引擎的使用方法和用户需求,就诞生了新的流量和内容入口,搜索就变成了AI的子功能,以前的计算广告投放模式会受影响。


AI吞噬一切,重新安排其重要性。


是时候拥抱新世界,做些新东西。总比苹果做好一切,国内再模仿来得强。AI 时代与流量时代完全不同,起码「模仿式创新」一定会变难。


02 AI改变个人工作流,但尚未改变行业


生成式AI的冲击改变了科技行业的轨迹,但普通人视角下,冲击在ChatGPT发布之后就逐渐放缓。


文字工作者(比如我)和广义的内容创作者们,早已全面拥抱AI。尽管AI很难写出80分的作品,但它可以高效满足创作者工作流中的离散需求:快速生产大纲、和用户一起头脑风暴、模仿文风、文本修改、长文本翻译、文字 - 语音互转、信息获取、数据整理、梳理财报等等,这些方面AI又快又好。


在艺术、影视、教育、人文学术圈,AI颇受欢迎,它提供了快速试错过筛的工具,加上自身也是卖点和噱头,AI成了一种隐喻修辞,代表着机遇,以及危机感。



任何研讨会加个「AI时代」的名头都能多吸引点注意力和流量。


这一波生成式AI的发展可能会经历四个阶段:惊艳的玩具,(多样化且具备替代效应的)生产力工具,个人化系统,(具有网络效应)的生态系统。


目前的产品大多在从第一阶段到第二阶段过渡。


大部分AI产品,包括国外的,长期用下来,除了内嵌在应用和网页中的AI和特定用途AI以外(比如wiki AI,notion AI,memo AI,Perplexity),大多还是花里胡哨,重复造轮子居多。


AI在当下,尝鲜多于工作,助力于个人多于组织,它只改变了游戏的乐趣,并未改变游戏规则,犹如个人写东西用Word 还是Ulysses,只有体验的细微区别,无关乎生产力。工具需的组织化、社会化、网络化,才能最大化效能(比如微信和github)。


回到产业,AI尚未颠覆任何领域,干掉任何公司——除了做二次开发(套壳)的公司,在每次OpenAI发布新产品时都哀叹不已。行业替代性在客服、审核等岗位的确存在,只是尚未爆发,因为AI还未先进到重塑流程。


与互联网浪潮不同,大模型时代也许不需要Killerapp,无论AI多么强大,整体提升Workflow,提供端到端的输出,都比较难。这些流程依赖于长程推理、常识和行业Know-how,光靠语义链接的桥梁还远远不够。


大模型作为一个概率模型,在低容错率场景时仍然面临很多问题,远没有我们想的那么神奇:我在写这篇文章时,让GPT-4o查询NVIDIA近年股票和市值变化,一个看似简单的问题,它需要现将问题拆分成步骤,然后分别去搜相应的信息,再做一个总结,最后居然还是错的,还不如直接用搜索引擎快。


此外,很多定制化的工作,可能90%的文档都不能满足大模型Embedding时的质量要求,还要做大量的数据清洗才能用。大模型的注意力也不够稳定,经常被不相关的问题干扰,出现幻觉。



大模型的产品发展与互联网的产品发展还有一个截然不同的地方:边际成本非常高,模型成本要远远高于人力成本和买量成本。移动互联网时代的App可以在小步快跑式迭代,但基于底层大模型+开源小模型的鸡尾酒分层打法的App尚未找到类似路径。也因此,还未出现大公司被小公司弯道超车的可能性。


当然,假以时日,AI也许能在软件编写上有所建树。纽约市的风险投资基金Pace Capital的创始合伙人Chris Paik在「软件的终结」(The End of Software)一文里提出,大模型不一定会颠覆toC产品,但有可能颠覆软件生产,因为软件的成本在于开发人员,他们将人类语言翻译成计算机语言,大模型也许比人更擅长做这事,形成液态系统,建立中间层,链接一切。


「代码将变得灵活可塑,传统的技术栈概念将逐渐消失,取而代之的是由 AI 生成的微服务的流动海洋,这些微服务可以根据需要进行重新组合和再构」。


苹果说:我也是这样想的。


03 如果没有AGI,你还会期待AI吗?


不要太期待AGI。


在业界狂热讨论AGI何年达成之时,学界泼了三盆冷水。图灵奖得主、Meta首席AI科学家杨立昆(Yann Lecun)就并不认可AGI,他认为根本不存在通用智能,且大模型也不可能通向AGI。他还在X上说,「如果你是一名对构建下一代人工智能系统感兴趣的学生,不要研究大型语言模型(LLMs)」。


杨立昆并非唯一反对AGI的人。李飞飞从另一个角度论证了类似观点,她认为无论大模型有多少参数,AI都无法拥有「知觉」,即所有的感觉——饥饿、疼痛、坠入爱河,因此AI不可能拥有主观体验的能力,甚至不可能接近人类智能。


李飞飞曾经的老师,香港大学马毅认为,当前的生成AI其能力依靠规模定律(Scaling Laws)涌现其能力,但规模定律并非物理定律,而是一种偶然,早晚会失效,AI又不是只有喂数据堆参数这一种造法。


马毅在接受《晚点》采访时说,「如果你的信仰就是Scaling Laws,觉得把现在的系统做大就能实现AGI,我觉得你该改行了。因为你已经不可能有作为了,你就只能做一个螺丝钉」。大模型是有极限的,随着语料库耗尽,Scaling Law 失效,以及算力和电力几何级数增加,内部黑箱无法破解,也许有一天,生成式AI的发展出现停滞,不是不可能。


我想起,在AlphaGo/Zero大展威力的时代,人们对AI的能力感到格外惊奇和恐惧,代表人类最强棋手的李世石最后输给AI,似乎为碳基生命的命运写下最后注脚。


但从现在回看,并没有那么悲凉。


当时,我偶然和人工智能早期先驱、《GEB》作者侯世达(Douglas Hofstadter)见过一面,我问他,你觉得Alphago是否实现了某种意义上的「智能」?他说,非也,即使Alphago战胜了人类,但相比于人类,AI还是太简单,如同缸中之脑,对现实一无所知。他确信深度学习无法抵达智能,但可以很好地解决一些问题。


Sora出现时,人们讨论它是否理解物理世界(尽管它内置了牛顿定律),物理主义者可能会认为 AI= 大脑 = 智能 = 有无限潜力的理解工具,但拥有常识的人则会认为这是错误的问题。


如果没有AI,AI前进的动力和目标在哪里?


OpenAI联合创始人Greg Brockman有一个很好的比喻,人工智能被「烘焙」进了经济之中。意思是,如何部署 AI,需要融入其他「原料」混合,它们以不同的方式运作,等待一段时间后,开始发挥作用。从消费者的角度来看,与 ChatGPT的对话只是调用一次API,就如同访问一次网站,下载一部电影。随着技术进化,公司把AI做细,AI融入软件之间、用户界面以及无数中间层,功能变得越来越细微,用户就会习惯AI。


Apple对AI深度整合,即使平庸,至少可用。在未来,也许AI能服务每个人的日常生活,最后,你无需感受到AI的存在。大模型还没有诞生杀手级应用,但手机形态可能会比大多软件商活得更久,这是2024WWDC能隐约看到的图景。


本文来自微信公众号“周天财经”(ID:techfinsight),作者:向辉


AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/

4
免费使用GPT-4o

【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。

在线使用:https://ffa.chat/