AI资讯新闻榜单内容搜索-o1

小米计划30天内免费发100万亿Token，小米技术发文：Hermes Agent最近一月累计调用小米MiMo1.45万亿Token

5月12日，小米集团总裁卢伟冰发文：为回馈全球开发者，小米正式启动「MiMo Orbit 100T Token 计划」，面向全球 AI 用户免费发放 Token 权益，计划在 30 天内累计发放 100 万亿 Token。

来自主题: AI资讯

8116 点击 2026-05-12 15:21

GRPO遭遇瓶颈？G²RPO-A让自适应指导为小模型推理能力「开外挂」

大模型时代的「炼金术师」们，或许都曾面临一个共同的困扰：当我们试图将 DeepSeek-R1、OpenAI-o1 那种惊艳的推理能力迁移到小规模语言模型（SLMs）时，效果却总是差强人意。现有的强化学习方法如 GRPO 在 7B+ 的大模型上效果显著，但一旦应用到 1.7B 甚至更小参数的模型上，性能提升就微乎其微。

来自主题: AI技术研报

9042 点击 2026-05-07 10:16

哈佛Science重磅：AI急诊诊断准确率67%，超越资深主治！取代医生尚早

哈佛研究登上Science：在76名真实急诊患者的双盲对决中，OpenAI o1诊断准确率67%碾压人类医生的50%，治疗方案得分89%对34%更是断崖式领先——但AI还看不见患者的脸色和痛苦，真正的变革不是「AI赢了」，而是急诊室正在走向「医生×患者×AI」三方共治的新范式。

来自主题: AI资讯

9585 点击 2026-05-05 10:05

时薪 15 美元的新工种：把 iPhone 绑在脑门上，替 AI 蒸馏自己

你或许刷到了一段来自印度南部服装厂的视频。工厂工人佩戴头戴摄像头，记录手部动作以训练人工智能系统。这是因为随着特斯拉、Figure AI 等公司竞相开发人形机器人，训练它们所需的真实世界动作数据变

来自主题: AI资讯

10041 点击 2026-04-26 22:36

视觉大模型迎来“o1时刻”：腾讯混元提出SOAR，让AI在生成中学会自我纠偏

近日，腾讯混元团队提出HY-SOAR （Self-Correction for Optimal Alignment and Refinement），一种面向扩散模型和流匹配模型的数据驱动后训练方法。

来自主题: AI技术研报

8391 点击 2026-04-23 14:44

又走一个！OpenAI研究VP离职，转投Anthropic做RL研究员

OpenAI的人才地震还在继续！刚刚，前研究副总裁Max Schwarzer宣布离职，这位亲手主导o1、o3和整个GPT-5系列post-training的核心人物，选择加入Anthropic，重返一线RL研究。

来自主题: AI资讯

9718 点击 2026-03-05 14:57

00后，斯坦福辍学做AI创业，AI数据标注独角兽Micro1四年从零到估值173亿

其依据是Micro1的25亿美元（约合人民币173亿元）最新估值。福布斯报道称，成立于2022年的Micro1被曝正在以25亿美元估值洽谈新融资，如果Micro1锁定或超过这一估值，安萨里在该公司持有的约42%股份价值将超过10亿美元（约合人民币69亿元）。

来自主题: AI资讯

9589 点击 2026-02-16 11:14

o1之后下一个范式？隐式CoT大突破，让推理不再「碎碎念」

今天推荐一个 Implicit Chain-of-Thought（隐式推理）的最新进展 —— SIM-CoT（Supervised Implicit Chain-of-Thought）。它直击隐式 CoT 一直「扶不起来」的核心痛点：隐式 token 一旦 scale 上去，训练就容易塌缩到同质化的 latent 状态，推理语义直接丢失。

来自主题: AI技术研报

7756 点击 2026-02-02 09:31

不读博士，照样进OpenAI！o1核心成员现身说法了

如果没有PhD，是不是就和前沿AI研究没关系了？至少在Noam Brown看来，未必。这位OpenAI 研究员、o1的核心贡献者，刚刚分享了一串“非典型研究员”的经历。

来自主题: AI资讯

9738 点击 2026-01-25 12:02

35天，版本之子变路人甲：AI榜单太残酷！

o1从榜首暴跌至#56，Claude 3 Opus坠入#139。LMSYS榜单揭示残酷真相：大模型的「霸主保质期」只有35天！这不是技术迭代，这是对所有应用层开发者的降维屠杀。

来自主题: AI资讯

7163 点击 2026-01-16 10:54