ChatGPT,让Apple Intelligence能看见了
12月12日凌晨,OpenAI 的马拉松更新迎来了第五天。今天与其说是展示OpenAI的产品,不如说是一场OpenAI与苹果的“联姻”宣告。
在发布会一开始,OpenAI的CEO Sam Altman首先发言。
他以轻松的语气宣布了这个重要合作:“今天是关于让ChatGPT变得更容易使用。我们的朋友苹果正在为iPhone、iPad和macOS发布ChatGPT集成。”随后,来自工程团队的Dave和产品团队的McDon展示了具体的功能实现。
就在10月末尾,彭博社记者马克·古尔曼的最新一期《PowerOn》时事通讯中指出,苹果在AI领域至少落后头部公司两年时间。
这个判断来自于他得到的苹果内部分析。在分析报告中,OpenAI的ChatGPT在回答问题时的准确率就比苹果的Siri高出25%,且能回答30%更多的问题。在这样的背景下,苹果选择与OpenAI合作,将ChatGPT整合进iOS、iPadOS和macOS系统,似乎是无奈之举。
毕竟Apple Intelligence刚刚发布之时,苹果还信心满满的将OpenAI列为“合作伙伴”之一,意图用自己自研的模型唱主角。现在则不得不交出默认权限,让ChatGPT登堂入室。
如果你想看前三天OpenAI都发布了哪些有趣的东西,可以点击以下链接:
Sora终于来了!自带剪辑工具,145块就能玩|OpenAI直播第三天
OpenAI系列发布第二弹:“强化微调”惊艳了不在现场的奥特曼
OpenAI年末狂欢第一弹:“满血版”o1模型来了,还有个200美元/月的Pro版会员
这次Apple Intelligence对ChatGPT的深度整合主要包含三个方面:
首先是与Siri的协同。当Siri判断某个任务可能需要ChatGPT的协助时,它可以将任务移交给ChatGPT处理;
其次是写作工具的增强,用户现在可以使用ChatGPT从头开始撰写文档,还能进行文档细化和总结;
第三是iPhone 16的相机控制功能,它能够通过视觉智能让用户更深入地了解拍摄对象。
在实际演示环节,McDon展示了如何在iPhone上启用这些功能。用户需要首先进入设置,启用Apple intelligence和Siri,然后开启新的ChatGPT扩展。
用户可以选择登录ChatGPT账号,系统还提供了确认ChatGPT请求的选项,确保用户对数据分享有完全的控制权。
特别值得注意的是,Apple Intelligence在这里是以拓展(extension)的方式调用的ChatGPT,这为之后其他第三方调用开了个口子。但至少当下,ChatGPT是唯一的选择。
团队现场策划了一场圣诞派对。通过简单地让Siri询问ChatGPT,系统就能生成完整的派对计划,包括一张歌单建议。
特别引人注目的是,用户可以轻松地在ChatGPT应用程序中继续编辑和完善这些建议。演示中还包括了生成节日播放列表和专辑封面的有趣环节,其中特别加入了一个“青蛙”元素。
这展示了ChatGPT的创意能力,也让人想起苹果迟迟难以上线的Emoji生成能力。
这场发布会最引人注目的环节,就是ChatGPT为苹果设备带来的视觉智能能力。OpenAI团队用一场即兴的“圣诞毛衣大赛”来演示了这项技术。
当开发者长按iPhone的相机控制按钮,ChatGPT就能实时分析画面中的内容。在演示中,系统不仅能识别出每个人身上毛衣的特征,还能以一种近乎幽默的方式为这些节日装扮打分排名。
但ChatGPT最后宣布Sam Altman平平无奇的毛衣是最具“趣味性”的,全场都大跌眼镜。看起来AI也会“向上管理”。
这项视觉集成的意义远不止于此。它实际上弥补了苹果AI系统最致命的短板之一。
要知道,在此之前,Siri的视觉识别能力一直是其软肋,而现在通过与ChatGPT的合作,iPhone用户可以随时通过相机获取周围物体的深度信息和解释。这种即时的视觉分析能力是苹果向竞争对手低头的象征——承认在某些领域,与其执着于自研,不如寻求最好的合作伙伴。毕竟在国产手机AI系统都突飞猛进的当下,让用户再多等一年才能体验到这个核心功能,风险太大。
但这次发布会演示的ChatGPT的视觉能力,与前两天Greg Brockman给《60 Minutes》节目展示的能实时语音对话的ChatGPT视觉比起来,操作上显得更麻烦。你得输入文字,才能获得回答。不知道是苹果有意限制OpenAI,还是OpenAI的视觉能力还没做好完全的准备。
在Mac端的演示就有些索然无味了。用户只需在系统设置中启用Apple intelligence,就能在macOS 15.2 Sequoia中使用ChatGPT扩展。
值得注意的是,用户可以在几乎任何应用程序中唤醒Siri或写作工具。通过双击命令键,就能调出Siri提示框,而当Siri判断任务过于复杂时,系统会询问是否需要ChatGPT的协助。
再一次,Siri干不了的,就直接让渡给ChatGPT。
实际应用场景中,团队展示了如何处理一份49页的系统文档。用户可以选择分享整个PDF文件或仅分享截图,ChatGPT能够理解文档内容并回答相关问题。
所有对话都可以在ChatGPT桌面应用中保存和继续,这种无缝的体验正是这次整合的核心价值。
这次发布会的深层意义,远超表面的技术整合。
它标志着科技行业格局的一次微妙转变:OpenAI成功地将自己嵌入了全球最大消费级硬件生态系统的核心位置。
作为苹果智能的“半官方”合作伙伴,OpenAI将直接触达数十亿苹果设备用户。这种触达不是通过应用商店的下载,而是作为系统级服务存在——每一次Siri的求助,每一次文档处理的请求,都可能转化为对ChatGPT的调用。对OpenAI而言,这种系统级的整合带来的不仅是用户数量的暴增,更是品牌认知的根本提升:从“一个热门AI公司”变成“苹果设备的默认AI大脑”。
这种转变,某种程度上让OpenAI获得了类似ARM在移动处理器领域的地位。
而对始终标榜封闭生态的苹果来说,这种妥协既是无奈,也是务实:与其在AI领域继续落后,不如借助最好的工具来服务用户。毕竟在商业竞争中,有时候开放比固守更能赢得未来。
然而,就在这场温馨的“相亲发布会”进行前的一个小时,Google却扔下了重磅炸弹。Gemini 2.0 Flash的发布,就像一位不速之客闯入了别人的派对,而且还带来了让所有人侧目的礼物。
这个全新版本不仅在速度上实现了翻倍提升,还支持音频与图像的多模态输出能力,让它成了第一个接近实现原生双向多模态的模型,这让它对大模型行业的意义也是非比寻常。同时更强的原生工具使用能力,和由 Gemini 2.0 驱动的编码Agent(Colab 和 Jules)系统更是让昨天OpenAI的Canva展示显得相形见绌。
回顾OpenAI这五天的发布会,除了第一天的o1之外,其他日子的发布似乎都缺少了那份令人惊叹的创新。Sora的视频生成固然出色,与Canva的合作也颇具战略意义,但总给人一种“差了那么一点”的感觉。至于这次和苹果的合作,与其说是技术突破,不如说是一场商业联姻。那个充满节日气氛的倒数日历,就像一个精心包装却缺乏惊喜的圣诞礼物,拆开后难掩失望。
OpenAI这12天马拉松式的“AI嘉年华”发布会,现在看起来更像是一场精心设计的注意力管理战役:通过持续不断的小型更新来稀释竞争对手可能带来的冲击。
通过将发布会拉长,用类似“圣诞倒数日历”这样富有节日气氛的包装,OpenAI试图垄断整个十二月的科技头条。
然而,当Gemini 2.0带着令人瞠目的性能提升和多模态能力华丽登场时,这个精心编织的注意力网似乎瞬间被撕开了一道口子。
在残酷的科技竞争中,再精心的舞台设计也掩盖不了台下正在发生的真正变革。
文章来自微信公众号“腾讯科技”,作者“郝博阳”
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner
【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。
项目地址:https://github.com/Henry-23/VideoChat
在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat
【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。
项目地址:https://github.com/PeterH0323/Streamer-Sales