AI资讯新闻榜单内容搜索-o1

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: o1
GRPO遭遇瓶颈?G²RPO-A让自适应指导为小模型推理能力「开外挂」

GRPO遭遇瓶颈?G²RPO-A让自适应指导为小模型推理能力「开外挂」

GRPO遭遇瓶颈?G²RPO-A让自适应指导为小模型推理能力「开外挂」

大模型时代的「炼金术师」们,或许都曾面临一个共同的困扰:当我们试图将 DeepSeek-R1、OpenAI-o1 那种惊艳的推理能力迁移到小规模语言模型(SLMs)时,效果却总是差强人意。现有的强化学习方法如 GRPO 在 7B+ 的大模型上效果显著,但一旦应用到 1.7B 甚至更小参数的模型上,性能提升就微乎其微。

来自主题: AI技术研报
8037 点击    2026-05-07 10:16
哈佛Science重磅:AI急诊诊断准确率67%,超越资深主治!取代医生尚早

哈佛Science重磅:AI急诊诊断准确率67%,超越资深主治!取代医生尚早

哈佛Science重磅:AI急诊诊断准确率67%,超越资深主治!取代医生尚早

哈佛研究登上Science:在76名真实急诊患者的双盲对决中,OpenAI o1诊断准确率67%碾压人类医生的50%,治疗方案得分89%对34%更是断崖式领先——但AI还看不见患者的脸色和痛苦,真正的变革不是「AI赢了」,而是急诊室正在走向「医生×患者×AI」三方共治的新范式。

来自主题: AI资讯
8812 点击    2026-05-05 10:05
时薪 15 美元的新工种:把 iPhone 绑在脑门上,替 AI 蒸馏自己

时薪 15 美元的新工种:把 iPhone 绑在脑门上,替 AI 蒸馏自己

时薪 15 美元的新工种:把 iPhone 绑在脑门上,替 AI 蒸馏自己

你或许刷到了一段来自印度南部服装厂的视频。 工厂工人佩戴头戴摄像头,记录手部动作以训练人工智能系统。 这是因为随着特斯拉、Figure AI 等公司竞相开发人形机器人,训练它们所需的真实世界动作数据变

来自主题: AI资讯
9357 点击    2026-04-26 22:36
视觉大模型迎来“o1时刻”:腾讯混元提出SOAR,让AI在生成中学会自我纠偏

视觉大模型迎来“o1时刻”:腾讯混元提出SOAR,让AI在生成中学会自我纠偏

视觉大模型迎来“o1时刻”:腾讯混元提出SOAR,让AI在生成中学会自我纠偏

近日,腾讯混元团队提出HY-SOAR (Self-Correction for Optimal Alignment and Refinement),一种面向扩散模型和流匹配模型的数据驱动后训练方法。

来自主题: AI技术研报
7580 点击    2026-04-23 14:44
又走一个!OpenAI研究VP离职,转投Anthropic做RL研究员

又走一个!OpenAI研究VP离职,转投Anthropic做RL研究员

又走一个!OpenAI研究VP离职,转投Anthropic做RL研究员

OpenAI的人才地震还在继续!刚刚,前研究副总裁Max Schwarzer宣布离职,这位亲手主导o1、o3和整个GPT-5系列post-training的核心人物,选择加入Anthropic,重返一线RL研究。

来自主题: AI资讯
9128 点击    2026-03-05 14:57
00后,斯坦福辍学做AI创业,AI数据标注独角兽Micro1四年从零到估值173亿

00后,斯坦福辍学做AI创业,AI数据标注独角兽Micro1四年从零到估值173亿

00后,斯坦福辍学做AI创业,AI数据标注独角兽Micro1四年从零到估值173亿

其依据是Micro1的25亿美元(约合人民币173亿元)最新估值。福布斯报道称,成立于2022年的Micro1被曝正在以25亿美元估值洽谈新融资,如果Micro1锁定或超过这一估值,安萨里在该公司持有的约42%股份价值将超过10亿美元(约合人民币69亿元)。

来自主题: AI资讯
8932 点击    2026-02-16 11:14
o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」

o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」

o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」

今天推荐一个 Implicit Chain-of-Thought(隐式推理) 的最新进展 —— SIM-CoT(Supervised Implicit Chain-of-Thought)。它直击隐式 CoT 一直「扶不起来」的核心痛点:隐式 token 一旦 scale 上去,训练就容易塌缩到同质化的 latent 状态,推理语义直接丢失。

来自主题: AI技术研报
7152 点击    2026-02-02 09:31
不读博士,照样进OpenAI!o1核心成员现身说法了

不读博士,照样进OpenAI!o1核心成员现身说法了

不读博士,照样进OpenAI!o1核心成员现身说法了

如果没有PhD,是不是就和前沿AI研究没关系了?至少在Noam Brown看来,未必。这位OpenAI 研究员、o1的核心贡献者,刚刚分享了一串“非典型研究员”的经历。

来自主题: AI资讯
9283 点击    2026-01-25 12:02
35天,版本之子变路人甲:AI榜单太残酷!

35天,版本之子变路人甲:AI榜单太残酷!

35天,版本之子变路人甲:AI榜单太残酷!

o1从榜首暴跌至#56,Claude 3 Opus坠入#139。LMSYS榜单揭示残酷真相:大模型的「霸主保质期」只有35天!这不是技术迭代,这是对所有应用层开发者的降维屠杀。

来自主题: AI资讯
6636 点击    2026-01-16 10:54
5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级

5天连更5次,可灵AI年末“狂飙式”升级

12月伊始,可灵AI接连放出大招。全球首个统一的多模态视频及图片创作工具“可灵O1”、具备“音画同出”能力的可灵2.6模型、可灵数字人2.0功能……5天内5次“上新”,直接让生成式AI领域的竞争“卷”出新高度。

来自主题: AI资讯
8077 点击    2025-12-10 14:32