AI资讯新闻榜单内容搜索-o1

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: o1

验证者定律，智能的锯齿边缘和商品化，CoT之父Jason Wei2025AI进展的三个思路

验证者定律，智能的锯齿边缘和商品化，CoT之父Jason Wei2025AI进展的三个思路

验证者定律，智能的锯齿边缘和商品化，CoT之父Jason Wei2025AI进展的三个思路

在这片喧嚣和迷雾之中，我们迫切需要一个清晰的导航图。而Jason Wei正是提供这份地图的最佳人选之一。他现任Meta超级智能实验室（Meta Super Intelligence Labs）的研究科学家，此前在OpenAI工作了两年，o1研发的主导者，更早之前是Google Brain的科学家。

来自主题: AI技术研报

7687 点击 2025-10-25 13:09

GPT-5≈o3.1！OpenAI首次详解思考机制：RL+预训练才是AGI正道

GPT-5≈o3.1！OpenAI首次详解思考机制：RL+预训练才是AGI正道

GPT-5≈o3.1！OpenAI首次详解思考机制：RL+预训练才是AGI正道

在某种程度上，GPT-5可以被视作是o3.1。该观点出自OpenAI研究副总裁Jerry Tworek的首次播客采访，而Jerry其人，正是o1模型的主导者之一。

来自主题: AI资讯

6732 点击 2025-10-20 15:26

SALMONN 系列音视频理解大模型霸榜回归！推理增强、高帧率、无文本泄漏全线突破

SALMONN 系列音视频理解大模型霸榜回归！推理增强、高帧率、无文本泄漏全线突破

SALMONN 系列音视频理解大模型霸榜回归！推理增强、高帧率、无文本泄漏全线突破

全新一代 video-SALMONN 2/2+、首个开源推理增强型音视频理解大模型 video-SALMONN-o1（ICML 2025）、首个高帧率视频理解大模型 F-16（ICML 2025），以及无文本泄漏基准测试 AVUT（EMNLP 2025）正式发布。新阵容在视频理解能力与评测体系全线突破，全面巩固 SALMONN 家族在开源音视频理解大模型赛道的领先地位。

来自主题: AI资讯

7463 点击 2025-09-30 10:44

Scale AI转向Meta后留市场空白，00后斯坦福肄业生抢微软等客户，已完成2.5亿元融资

Scale AI转向Meta后留市场空白，00后斯坦福肄业生抢微软等客户，已完成2.5亿元融资

Scale AI转向Meta后留市场空白，00后斯坦福肄业生抢微软等客户，已完成2.5亿元融资

就在 Scale AI 公司的 95 后创始人 Alexandr Wang 在 Meta 挑大梁之际，他迎来了一位比他更小的 00 后劲敌。这名 00 后叫阿里·安萨里（Ali Ansari），是一名

来自主题: AI资讯

8311 点击 2025-09-15 08:35

隐式推理，继CoT思维链之后，LLM的下一个技术奇点系统性综述来了｜港科大最新

隐式推理，继CoT思维链之后，LLM的下一个技术奇点系统性综述来了｜港科大最新

隐式推理，继CoT思维链之后，LLM的下一个技术奇点系统性综述来了｜港科大最新

您对“思维链”（Chain-of-Thought）肯定不陌生，从最早的GPT-o1到后来震惊世界的Deepseek-R1，它通过让模型输出详细的思考步骤，确实解决了许多复杂的推理问题。但您肯定也为它那冗长的输出、高昂的API费用和感人的延迟头疼过，这些在产品落地时都是实实在在的阻碍。

来自主题: AI技术研报

8484 点击 2025-09-05 10:22

4o-mini华人领队也离职了，这次不怪小扎

4o-mini华人领队也离职了，这次不怪小扎

4o-mini华人领队也离职了，这次不怪小扎

哦豁，OpenAI奥特曼又痛失一员大将。 Kevin Lu，领导4o-mini发布，并参与o1-mini、o3发布，主要研究强化学习、小模型和合成数据。

来自主题: AI资讯

6904 点击 2025-08-19 11:20

一手实测OpenAI新开源的GPT OSS，o1和GPT-4o都要过气了。

一手实测OpenAI新开源的GPT OSS，o1和GPT-4o都要过气了。

一手实测OpenAI新开源的GPT OSS，o1和GPT-4o都要过气了。

gpt-oss-120b 和 gpt-oss-20b OpenAI终于把开源的模型放出来了。 gpt-oss系列也是自GPT2以来，OpenAI首次开源的大语言模型。

来自主题: AI产品测评

8854 点击 2025-08-06 17:08

“神经-符号”融合规划器性能显著超越o1：借鉴人类运动学习机制｜中国科学院磐石研发团队

“神经-符号”融合规划器性能显著超越o1：借鉴人类运动学习机制｜中国科学院磐石研发团队

“神经-符号”融合规划器性能显著超越o1：借鉴人类运动学习机制｜中国科学院磐石研发团队

科研er看过来！还在反复尝试材料组合方案，耗时又耗力？新型“神经-符号”融合规划器直接帮你一键锁定高效又精准的科研智能规划。

来自主题: AI技术研报

7731 点击 2025-08-06 16:01

思维链监督和强化的图表推理，7B模型媲美闭源大尺寸模型

思维链监督和强化的图表推理，7B模型媲美闭源大尺寸模型

思维链监督和强化的图表推理，7B模型媲美闭源大尺寸模型

近期，随着OpenAI-o1/o3和Deepseek-R1的成功，基于强化学习的微调方法（R1-Style）在AI领域引起广泛关注。这些方法在数学推理和代码智能方面展现出色表现，但在通用多模态数据上的应用研究仍有待深入。

来自主题: AI技术研报

7821 点击 2025-08-01 16:08

SPIRAL：零和游戏自对弈成为语言模型推理训练的「免费午餐」

SPIRAL：零和游戏自对弈成为语言模型推理训练的「免费午餐」

SPIRAL：零和游戏自对弈成为语言模型推理训练的「免费午餐」

近年来，OpenAI o1 和 DeepSeek-R1 等模型的成功证明了强化学习能够显著提升语言模型的推理能力。通过基于结果的奖励机制，强化学习使模型能够发展出可泛化的推理策略，在复杂问题上取得了监督微调难以企及的进展。

来自主题: AI技术研报

5639 点击 2025-07-31 10:10

上一页当前第1页,共34页下一页