# 热门搜索 #
搜索
你不可错过的 OpenAI 新模型 O1 及公司关键发展里程碑介绍
3146点击    2024-09-14 10:42

备受瞩目的“草莓”模型现已问世,OpenAI 宣称该模型能够应对更为复杂的查询需求,当然,其使用成本也相对较高。


OpenAI 突袭推出具有推理能力的新模型o1


OpenAI 于9月13日凌晨突袭推出了名为 o1 的新模型,这是其一系列“推理”模型计划中的第一个模型,这些模型经过训练可以比人类更快地回答更复杂的问题。


同时推出的还有 o1-mini,这是一个体积更小、成本更低的版本。如果你一直密切关注OpenAI产品动态,o1 实际上就是此前备受期待的草莓模型。 


对 OpenAI 而言,o1 不仅仅是向类人人工智能(human-like artificial intelligence)迈进的一步,它在编码和解决多步骤问题方面的能力也超越了之前的模型。


然而,与 GPT-4o 相比,o1 的使用成本更高,响应速度也稍慢。因此,OpenAI 将 o1 的此次发布定位为“预览版”,以凸显其尚处于早期阶段。 



从今天起,ChatGPT Plus 和 Team 用户将能够使用 o1-preview 和 o1-mini,而 Enterprise 和 Edu 用户将在下周初获得使用权限。


OpenAI 计划未来为 ChatGPT 的所有免费用户提供 o1-mini 的访问权限,尽管具体日期尚未确定。对于开发者而言,o1 的使用成本相对较高:在 API 中,o1-preview 的费用为每 100 万个输入代币 15 美元,每 100 万个输出代币则为 60 美元。作为对比,GPT-4o 的费用为每 100 万个输入代币 5 美元,每 100 万个输出代币 15 美元。 


OpenAI 研究负责人 Jerry Tworek 透露,o1 的训练方式与前代产品有本质区别,尽管公司对于确切细节保持神秘。他表示,o1 采用了“全新的优化算法和专门定制的训练数据集进行训练。”



OpenAI 以往的 GPT 模型被训练来模仿训练数据中的模式。然而,对于 o1,该公司采用了强化学习技术,通过奖励和惩罚(在机器学习和人工智能的上下文中,"penalties" 可以指在训练算法时用于防止过拟合或其他不希望的行为的惩罚项。例如,在正则化方法中,可能会对模型的复杂度施加惩罚,以促使模型学习更简单的、泛化能力更强的模式。)来训练模型独立解决问题。o1 还采用了“思维链”(chain of thought)的方式来处理查询,这与人类逐步分析和解决问题的方式相似。


这种新颖的训练方法让 OpenAI 对模型的准确性抱有更高的期望。“我们注意到这个模型产生的幻觉现象有所减少,”Tworek 表示。尽管如此,他同时指出,这一问题并未完全解决。“我们还不能说我们已经彻底解决了幻觉问题。”


据 OpenAI 称,o1 与 GPT-4o 的主要区别在于,o1 在处理编码和数学等复杂问题上表现得更为出色,并且能够解释其推理过程。


“这个模型在解决 AP 数学测试方面肯定比我强,我大学时还辅修过数学,”OpenAI 首席研究官 Bob McGrew 分享道。他还提到,在国际数学奥林匹克竞赛的资格考中,o1 的正确解决率高达 83%,而 GPT-4o 仅为 13%。


在知名的在线编程竞赛平台 Codeforces 上举办的竞赛中,这款新模型的表现已经达到了所有参赛者的前89%。OpenAI 还宣称,该模型的下一次更新将能够在物理、化学和生物学等领域的复杂基准测试任务中,展现出达到博士生水准的性能。


同时,o1 在许多方面并不如 GPT-4o 强大。它在世界事实知识方面的表现并不出色,也不具备浏览网页或处理文件和图像的功能。尽管如此,OpenAI 相信 o1 代表了一种全新的能力。o1 的命名意在表示“将计数器重置回 1”,象征着一个新的开始。


“坦白说,我认为我们传统上在命名方面并不擅长,”McGrew 坦言。“所以我希望这是迈向更新颖、更合理的命名方式的第一步,这些名字能更好地向世界传达我们正在做的事情。”


Tworek 指出,OpenAI 并不认同将 AI 模型的思维方式与人类思维等同起来。但他也提到,该界面旨在展示模型如何在解决问题时投入更多时间并进行更深入的分析。“在某些方面,它给人的感觉比以前的模型更接近人类。”


“你会发现,在很多方面它给人的感觉有些陌生,但在其他一些方面,它又出奇地接近人类的思维方式,”McGrew 说。由于模型处理查询的时间有限,它可能会说:“哦,我的时间不多了,让我快速给出答案。”在其思维链的早期阶段,它甚至可能会表现出集思广益的过程,比如:“我可以这样做或那样,我应该选择哪个方案?”


积极布局agents


当前的大型语言模型并不具备真正的智能。它们主要通过预测单词序列,依据从海量数据中学习到的模式来生成答案。例如,ChatGPT 有时会错误地声称“草莓”(strawberry)这个词只有两个字母“R”,因为它没有正确地解析这个词的结构。不过,值得一提的是,新的 o1 模型在这方面的表现则准确无误。


多方消息显示,OpenAI 正计划以高达 1500 亿美元的估值筹集更多资金,公司的发展势头依赖于持续的研究创新。OpenAI 正在将推理能力整合到大语言模型(LLMs)中,因为他们已经展望到一个由能够自主作出决策并代表用户采取行动的系统或代理主导的未来。


对人工智能领域的研究者来说,发展推理能力是实现类人智能的关键一步。他们认为,如果一个模型能够超越单纯的模式识别,那么它有潜力在医学和工程等领域带来重大突破。尽管如此,目前 o1 模型的推理能力还相对较慢,不具备代理的高效性,并且对开发者而言使用成本较高。


“我们已经投入了数月的时间来研发推理能力,因为我们相信这实际上是实现关键性突破的所在,” McGrew 说道。“从根本上说,这是模型发展的一个新模式,它能够解决那些真正困难的问题,这是向类人智能水平迈进所必需的。”


ChatGPT重要发展时间线



2024年9月


OpenAI 宣布推出可以自我进行事实检查的新模型 OpenAI o1


OpenAI 发布了 OpenAI o1 的预览版,也被称为“草莓”。这些模型系列可以在 ChatGPT 中以及通过 OpenAI 的 API 获得:o1-preview 和 o1-mini。


该公司声称,o1 能够更有效地通过数学和科学进行推理,并通过花更多时间考虑命令或问题的所有部分来自我进行事实检查。


与 ChatGPT 不同,o1 目前还不能浏览网页或分析文件,而且与其他模型相比,它的使用有速率限制且成本较高。OpenAI 表示,计划向 ChatGPT 的所有免费用户提供 o1-mini 访问权限,但尚未确定具体的发布日期。


OpenAI 的企业产品付费用户达到 100 万


OpenAI 宣布其面向企业的 ChatGPT 版本的付费用户已超过 100 万,这包括 ChatGPT Team、ChatGPT Enterprise 及其教育产品 ChatGPT Edu。该公司表示,OpenAI 近一半的企业用户位于美国。


大众汽车在美国市场推出 ChatGPT 助手


大众汽车将 ChatGPT 语音助手实验推广到在美国市场上市的汽车上。其集成了 ChatGPT 的 Plus Speech 语音助手是基于 Cerence 的 Chat Pro 产品和 OpenAI 的大语言模型(LLM)开发的 AI 聊天机器人,并将从9月6日开始在2025款 Jetta 和 Jetta GLI 车型上推出。


2024 年 8 月


OpenAI 与 Condé Nast 签署内容合作协议


根据这项新协议,OpenAI 将在 ChatGPT 和 SearchGPT 服务中整合并展示 Condé Nast 旗下各大品牌的内容,包括《纽约客》、《时尚》、《名利场》、《美食》和《连线》等。


Condé Nast 首席执行官 Roger Lynch 表示,这是一项为期数年的合作协议,OpenAI 将以某种形式向 Condé Nast 支付费用。Condé Nast 的一位发言人向 TechCrunch 透露,OpenAI 已获得权限,可以在其训练过程中使用 Condé Nast 的内容。


ChatGPT 移动应用迎来收入最高的月份


继 OpenAI 推出全新的 GPT-4o “全能”模型后,ChatGPT 移动应用迎来了其上线以来收入最高的一个月。据应用分析公司 Appfigures 提供的数据显示,该应用在 7 月份从苹果 App Store 和谷歌 Google Play 两大平台共获得了 2800 万美元的净收入。


2024 年 7 月


OpenAI 宣布推出新型搜索引擎原型 SearchGPT


OpenAI 正在测试一款名为 SearchGPT 的创新人工智能搜索引擎,旨在挑战谷歌的搜索霸主地位。SearchGPT 致力于通过提供互联网上的“即时答案”和支持后续问题提问的功能,来优化用户的搜索体验。目前,这一试验性原型仅限于少数用户和包括《大西洋月刊》在内的出版合作伙伴进行测试和反馈。


报告预测 OpenAI 今年可能面临高达 50 亿美元的亏损


根据《The Information》发布的一份新报告,该报告基于未公开的财务数据,指出由于运营成本极高,OpenAI 今年可能遭受高达 50 亿美元的亏损。报告还预测,该公司在 2024 年可能需要投入高达 70 亿美元用于 ChatGPT 的培训和运营。


OpenAI 发布 GPT-4o mini 模型


OpenAI 推出了其最新小型人工智能模型——GPT-4o mini。该公司宣称,GPT-4o mini 在成本效益和处理速度上均优于现有的 AI 模型,并且在涉及文本和视觉的推理任务中表现超越了业界的小型 AI 模型标准。GPT-4o mini 将接替 GPT-3.5 Turbo,成为 OpenAI 提供的最小型号 AI 模型。


2024 年 6 月


ChatGPT 推出 Mac 版应用程序


ChatGPT 现正式为 macOS 用户推出官方应用程序。用户现在可以通过 Option + Space 的键盘快捷键迅速唤醒 ChatGPT。这款应用不仅支持文件和图片的上传,还允许用户直接在桌面端与 ChatGPT 互动,并轻松查找过往的对话记录。


Apple 在其应用中整合 ChatGPT,包括 Siri


在 2024 年的全球开发者大会(WWDC)上,Apple 宣布将 ChatGPT 技术整合进 Siri 及其操作系统中的一系列第一方应用和服务中。这些由 GPT-4o 提供支持的 ChatGPT 功能将在今年晚些时候随着 iOS 18、iPadOS 18 以及 macOS Sequoia 的更新而向用户推出。


用户可以免费享受这些服务,且无需额外注册 ChatGPT 或 OpenAI 账户。此外,Apple 设备的用户还将能够体验到一些专为付费 ChatGPT 用户设计的独特功能。


2024年5月


OpenAI 与普华永道达成企业级合作


管理咨询行业的领头羊普华永道与 OpenAI 签订了一项新协议,普华永道将成为 OpenAI 目前最大的客户,服务其 10 万名员工,并且普华永道也将成为 OpenAI 向其他企业推广其企业产品的首个合作伙伴。


OpenAI 正在训练 GPT-4 的后续旗舰模型


在最近成立的安全和保障委员会的公告中,OpenAI 透露,他们已经开始训练 GPT-4 的后续旗舰模型。该委员会将负责为 OpenAI 的全线产品提供安全和保障方面的决策支持。


OpenAI 前董事透露董事会对 ChatGPT 的了解始于 Twitter


在 TED AI Show 播客节目中,前 OpenAI 董事会成员 Helen Toner 披露,董事会成员直到 2022 年 11 月 ChatGPT 正式发布时才得知该项目。她还指出,Sam Altman 对董事会提供了有关公司安全流程的不准确信息,并且未透露其参与 OpenAI 创业基金的情况。


ChatGPT 移动应用收入在 GPT-4o 发布后激增


尽管 GPT-4o 模型在网络上免费提供,但其发布仍推动了 ChatGPT 移动应用收入的空前增长。若移动用户希望体验 OpenAI 的最新产品,他们被鼓励升级至每月 19.99 美元的 ChatGPT Plus 订阅服务。


ChatGPT 支持从 Google Drive 和 Microsoft OneDrive 添加文件


OpenAI 宣布了 ChatGPT 的新功能更新,使用户能够更便捷地进行数据分析。用户现在可以直接从 Google Drive 和 Microsoft OneDrive 上传文件,与表格和图表进行互动,并导出定制图表用于演示。这些新特性预计将在未来几周内集成到 GPT-4o 模型中。


OpenAI 与 Reddit 合作,利用其数据训练 AI


OpenAI 宣布与 Reddit 建立伙伴关系,将获得访问 Reddit “实时、结构化和独特内容”的权限。Reddit 的内容将被整合进 ChatGPT,同时两家公司将合作为 Reddit 用户和版主带来由人工智能驱动的新功能。


OpenAI 推出 GPT-4o“全能”模型,现已支持 ChatGPT


在 OpenAI 的春季更新活动中,公司展示了其新的全能模型 GPT-4o,该模型拥有类似黑洞的界面设计,以及类似电影《她》中的语音和视觉交互能力。GPT-4o 将在未来几周内逐步推广至 OpenAI 的各类开发者和消费者产品中。


OpenAI 将开发工具允许内容创作者选择退出 AI 训练


公司宣布正在开发名为“媒体管理器”的工具,让内容创作者能够更好地控制其内容被用于训练生成式 AI 模型的方式,并提供退出选项。该工具预计将在 2025 年之前准备就绪并投入使用。


2024 年 4 月


OpenAI 与《金融时报》签署内容许可协议


OpenAI 与伦敦的《金融时报》建立了新的合作伙伴关系,该公司将为内容访问付费。《金融时报》在一份新闻稿中表示:“通过此次合作,ChatGPT 用户将能够在相关查询的回应中看到精选的归因摘要、引述以及《金融时报》新闻报道的丰富链接。”


OpenAI 在东京开设新中心,并推出针对日语优化的 GPT-4 模型


OpenAI 宣布在东京开设新办事处,并计划推出专门针对日语优化的 GPT-4 模型。这一举措突显了 OpenAI 在扩张过程中可能需要将其技术本地化为不同语言的需求。


Sam Altman 向财富 500 强公司推广 ChatGPT Enterprise


据路透社报道,OpenAI 的首席执行官 Sam Altman 在 4 月份接待了来自多个城市的财富 500 强公司的数百名高管,向他们推介了专为企业使用设计的人工智能服务版本。


OpenAI 发布“更直接、更简洁”的 GPT-4 Turbo 版本


付费 ChatGPT 用户(包括 ChatGPT Plus、Team 或 Enterprise 的客户)可以开始使用 GPT-4 Turbo 的更新和增强版本。OpenAI 声称,新模型在写作、数学、逻辑推理和编码方面都有改进,并拥有更更新的知识库。


ChatGPT 不再需要注册账户 - 但有一个限制


现在,用户可以在不注册账户的情况下使用 ChatGPT,但这种体验并不完全相同。用户将无法保存或分享聊天、使用自定义指令或享受与持续账户相关的其他功能。据 OpenAI 称,这个版本的 ChatGPT 将有“稍微更严格的内容政策”。然而,当 TechCrunch 寻求更多细节时,回应并不明确。


2024 年 3 月


报告指出 ChatGPT 日均耗电量超过五十万千瓦时


最新评估显示,ChatGPT 的环境足迹相当庞大。《纽约客》的一篇报道指出,为了每天处理近 2 亿次的用户请求,ChatGPT 消耗的电量大约是美国一般家庭的 17,000 倍。


ChatGPT 现推出文本朗读功能


OpenAI 为 ChatGPT 的网页版及 iOS 和 Android 应用新增了朗读功能。该公司透露,这项新功能使 ChatGPT 能够以五种不同的语音之一,大声朗读其对用户问题的答复,并且支持多达 37 种语言的朗读。无论是 GPT-4 还是 GPT-3.5 模型,用户都可以享受到这一朗读功能。


2024 年 2 月


ChatGPT 引入记忆控制功能,可记住或遗忘用户指定内容


作为一项新测试的一部分,OpenAI 正在向 ChatGPT 的部分免费和付费用户推出“记忆”控制功能,并计划未来进行更广泛的推广。这些新功能允许用户指示 ChatGPT 记住特定信息、查看其记忆内容或完全关闭记忆功能。需要注意的是,从聊天记录中删除对话并不会清除 ChatGPT 或自定义 GPT 的记忆——用户需要直接删除记忆本身。


OpenAI 推出“临时聊天”功能,提供全新的对话体验


“临时聊天”功能最初仅向一小群免费和订阅用户开放,允许用户在没有任何历史对话记录的情况下与 ChatGPT 进行交流。在临时聊天模式下,ChatGPT 不会记得之前的对话内容或访问记忆,但如果启用了自定义指令,它将遵循这些指令。OpenAI 表示,出于安全考虑,可能会将临时聊天对话的副本保留最多 30 天。


2024 年 1 月


ChatGPT 用户现可在对话中直接调用 GPT


ChatGPT 的付费用户现在可以通过输入“@”符号并从列表中选择,将不同的 GPT 模型引入对话中。被选中的 GPT 将能够理解整个对话的上下文,并根据不同的用例和需求,用户可以标记不同的 GPT 参与对话。


芥川奖得主透露其获奖作品中约 5% 由 ChatGPT 撰写


作家 Rie Kudan 在其获奖作品《同情的东京塔》中,约有 5% 的内容直接引用了 ChatGPT 生成的句子。这部小说的背景设定在一个人工智能无处不在的未来世界,其获奖也引发了关于人工智能在文学创作中角色的讨论。


Sam Altman 透露 ChatGPT 将增加视频功能,并预告 GPT-5 的发布


在与比尔·盖茨的 Unconfuse Me 播客对话中,Sam Altman 确认了即将发布的 GPT-5 将支持全面的多模态交互,包括语音、图像、代码和视频。Altman 表示,GPT-5 预计将在 2024 年的某个时候发布。


OpenAI 组建团队,将公众意见融入 AI 模型治理中


OpenAI 正在组建一个由研究人员和工程师组成的团队,旨在创建一个系统,将公众对其 AI 模型行为的反馈和建议“编码”到 OpenAI 的产品和服务中。这是 OpenAI 公共计划的一部分,目的是通过资助实验项目,建立一个“民主程序”来决定 AI 系统应遵循的规则。


ChatGPT 推出针对小型团队的订阅计划


名为 ChatGPT Team 的新计划为多达 149 人的团队提供专用工作空间,并提供团队管理工具。除了提供对 GPT-4、GPT-4 with Vision 和 DALL-E3 的访问外,ChatGPT Team 还允许团队根据业务需求构建和共享定制化的 GPT。


OpenAI GPT 商店正式上线


经过数月的准备,OpenAI 的 GPT 商店现已开放。用户可以在 ChatGPT 网页客户端的新标签页中访问这一功能,其中包括由 OpenAI 合作伙伴和广泛的开发社区开发的多种 GPT 模型。


要访问 GPT 商店,用户需要订阅 OpenAI 的高级 ChatGPT 计划,包括 ChatGPT Plus、ChatGPT Enterprise 或新推出的 ChatGPT Team。


常见问题解答(FAQs):


1、什么是 ChatGPT?它是如何运作的?


ChatGPT 是由科技创业公司 OpenAI 开发的一款多功能聊天机器人,它运用人工智能技术,在用户输入提示后生成文本。这款聊天机器人基于 GPT-4 这一大型语言模型,该模型采用深度学习技术,能够产出接近人类的文本内容。


2、ChatGPT 何时对外发布?


ChatGPT 于 2022 年 11 月 30 日开始对公众开放使用。


3、ChatGPT 中的 "GPT" 代表什么?


GPT 代表 "Generative Pre-trained Transformer",即 "生成式预训练转换器"。


4、ChatGPT 和传统聊天机器人有什么区别?


聊天机器人可以是任何与用户进行对话的软件或系统,它们不一定要由人工智能驱动。例如,一些基于规则的聊天机器人会根据问题提供预设的回答。而 ChatGPT 则是由人工智能驱动的,它使用大语言模型(LLM)技术,在接收到用户提示后生成文本。


5、ChatGPT 如何处理数据隐私?


OpenAI 表示,“某些司法管辖区”(例如欧盟)的个人可以通过填写表格来反对其人工智能模型处理其个人信息。这包括请求删除人工智能生成的有关您的参考信息。尽管 OpenAI 指出,它可能不会批准所有请求,因为它必须“根据适用法律”平衡隐私请求与言论自由。


用于删除您的数据请求的网络表单标题为“OpenAI Personal Data Removal Request”。


文章来自于“非凡产研”,作者“非凡产研”。




关键词: openai , AI , chatGPT , 人工智能
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

2
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT

3
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/

4
免费使用GPT-4o

【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。

在线使用:https://ffa.chat/