OpenAI发布季第十一天:ChatGPT深度集成Mac应用,从Chatbot变身AI Agent

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
OpenAI发布季第十一天:ChatGPT深度集成Mac应用,从Chatbot变身AI Agent
7231点击    2024-12-20 10:25

OpenAI 发布季第十一天,ChatGPT与Mac应用深度集成了——


此次带来编程和写作两方面的更新。


  • 桌面版ChatGPT能够和Warp(文件共享应用)、XCode编辑器等应用一起使用了。
  • OpenAI也支持在语音模式下与其他应用程序协同工作了,包括Notion、Apple Notes等。


OpenAI首席产品官凯文·韦尔(Kevin Weil)着重强调了ChatGPT从单纯的会话助手向更为强大的代理工具的转变,这意味着ChatGPT现在能够代表用户执行更多任务,为用户带来前所未有的便捷体验。


01 

首推三大功能


目前,用户已能通过MacOS桌面应用程序来查看和自动化他们的ChatGPT工作。尽管2025年还将有更多类似版本问世,但在此之前,OpenAI已率先推出了以下三大功能:


第一,借助“Work with Apps”功能,用户现在能够将ChatGPT接入更多编码应用程序,涵盖BBEdit、MatLab、Nova、Script Editor、TextMate、Android Studio、AppCode、CLion、DataGrip、GoLand、IntelliJ IDEA、PHPStorm、PyCharm、RubyMine、RustRover、WebStorm、Prompt以及Warp等。


OpenAI发布季第十一天:ChatGPT深度集成Mac应用,从Chatbot变身AI Agent


在MacOS桌面应用的演示中,OpenAI展示了人工智能如何深入一个应用程序,获取并理解其上下文信息。一旦用户通过“Work with Apps”功能选定某个应用,ChatGPT便能立即接入,洞察应用内部,提供即时帮助。


当然,ChatGPT不仅仅是一个简单的查看工具,它依托强大的人工智能模型,能够执行多种功能。在Warp的演示中,ChatGPT不仅能捕捉用户屏幕上的内容,还能深入应用内部,浏览更多信息。例如,在处理长串代码时,ChatGPT能够实现无滚动浏览,极大地提升了工作效率。


与Windows Recall功能相比,ChatGPT更注重与应用程序的实时协同工作,而非仅仅记录和构建回忆库。在另一场演示中,OpenAI团队将ChatGPT与XCode紧密结合,使得它可以在苹果的开发应用程序中工作。用户只需简单提出请求,ChatGPT便能生成代码或解决编程难题。


值得注意的是,OpenAI还展示了ChatGPT的一项新技能:它能够将生成的代码直接嵌入XCode中,这一功能有望极大地简化工作流程。尽管在实时演示中,ChatGPT的代码尝试遭遇了两次失败,但在第三次尝试时,OpenAI团队成功让代码运行起来。


第二,对于利用ChatGPT进行写作的用户,OpenAI宣布MacOS桌面应用程序现已实现对Apple Notes、Quip和Notion的支持。在现场演示中,OpenAI团队正浏览一份文档,该文档旨在为Notion中的徒步旅行活动制定指南。


OpenAI发布季第十一天:ChatGPT深度集成Mac应用,从Chatbot变身AI Agent


有了这个新功能,ChatGPT得以与Notion无缝协作。现场演示聚焦于文档中的特定文本段落,并设定任务为“补充这些对话要点”。此外,用户还可利用ChatGPT的搜索功能来生成回应。例如,在演示中,它根据所选文本生成了关于“诺顿皇帝(诺顿一世)”的对话要点,并附上引用及来源。


第三,除了文本选择、复制粘贴的传统操作外,MacOS桌面应用支持高级语音模式,同时能与其他应用程序协同工作。在此模式下,用户可在Apple Notes中设定“节日派对歌单”,并通过ChatGPT征询圣诞老人对候选歌曲的意见。ChatGPT甚至能指出用户的错误,如将圣诞歌曲《Frosty the Snowman》误写为《Freezy the Snowman》。


OpenAI发布季第十一天:ChatGPT深度集成Mac应用,从Chatbot变身AI Agent


这些功能现已正式发布,用户只需确保拥有最新版本的MacOS应用程序,并订阅了ChatGPT Plus、ChatGPT Pro、ChatGPT Team、ChatGPT Enterprise或ChatGPT Edu中的任一服务,即可立即体验。


在隐私保护方面,OpenAI特别强调,ChatGPT仅会在用户手动触发的情况下与应用程序进行交互。一旦该功能被激活,用户将明确知晓哪些内容将被附加到消息中,从而有效缓解隐私方面的担忧。


02 

又曝AGI彩蛋


OpenAI在第11天发布会最后表示:“在第12天,我们准备了极其特别的内容,千万不要错过哦!”


在演示屏幕的一角,可以看到名为“AGI_Interface.swift”的文件夹。这已经不是过去12天里首次出现此类惊喜了。几天前,OpenAI还揭晓了一个名为“超级秘密AGI”的日历活动彩蛋,这无疑进一步提升了人们对这12天系列公告的期待,大家纷纷猜测这些公告是否在共同描绘一幅通往通用智能的宏伟蓝图。


OpenAI发布季第十一天:ChatGPT深度集成Mac应用,从Chatbot变身AI Agent


OpenAI还透露,ChatGPT的Windows应用程序也将很快发布。但更令人震惊的消息是,他们确认了一个新智能体的存在,并预计将于2025年发布。OpenAI表示:“随着我们的模型变得越来越强大,ChatGPT将展现出越来越强的自主性。”


几周前,有传闻称OpenAI正在研发一款名为“Operator”的代理式人工智能,而该公司在第11天的发布活动上仅对这一计划进行了确认。或许,这一举动背后有着来自竞争对手的压力影响。


近期,谷歌宣布了Project Mariner项目,该智能体能够代表用户在网页浏览器选项卡上进行导航并执行操作。同样,微软也推出了Copilot Vision功能,它能在用户的网络浏览器中查看内容并提供相关信息。当然,Anthropic更早之前发布了Computer Use功能,它在时间上领先于其他同类工具。


现在,OpenAI的12天系列活动仅剩最后一天,而他们似乎将最精彩的部分留到了最后——一个全新且强大的前沿模型即将亮相。我们将拭目以待,看看OpenAI究竟带来了什么新产品,以及这个新模型与之前的o1模型有何不同。


值得一提的是,一些基准测试已经表明,o1模型是迄今为止最强大的人工智能模型之一,甚至在编码任务方面超越了Claude 3.5。近日,X平台的一位用户据称发现了GPT-4.5模型,尽管该模型目前仅提供有限的预览功能。


现在,所有的目光都聚焦在OpenAI身上,大家都翘首以待,看他们在发布会活动的最后一天将会带来怎样的惊喜。


文章来自微信公众号“Founder Park”,作者“Founder Park”


OpenAI发布季第十一天:ChatGPT深度集成Mac应用,从Chatbot变身AI Agent

关键词: AI , openai , chatGPT , 人工智能
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

4
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0