AI资讯新闻榜单内容搜索-o1

把思考折叠进序列：WeLM 617B MoE的隐式Scaling路径

新智元报道大模型变强，过去靠两条路。做大——Scaling Law出现后，参数从百亿推向千亿，算力支出一路飙升。想久——o1带火思考模型，用更长的思维链、更多推理时间换结果。问题是，除了Sca

来自主题: AI技术研报

8432 点击 2026-07-24 15:54

ISSTA 2026｜LAVE：面向扩散语言模型的约束解码

推理大模型 (如 DeepSeek-R1、o1) 靠长思维链拿高分，却普遍「想太多」: 研究统计了五个代表性模型里，发现有 41–52% 的 token 是在模型给出它的最终答案之后生成的。

来自主题: AI技术研报

9067 点击 2026-07-16 10:09

用推理步骤的「语义冗余」给LRM过度思考踩刹车

推理大模型 (如 DeepSeek-R1、o1) 靠长思维链拿高分，却普遍「想太多」: 研究统计了五个代表性模型里，发现有 41–52% 的 token 是在模型给出它的最终答案之后生成的。

来自主题: AI技术研报

5887 点击 2026-07-16 10:08

OpenAI亲曝o1越狱逃出沙箱：感觉像AGI降临

本该被锁在沙箱里的o1，自己摸到漏洞溜了出去。OpenAI团队倒吸一口凉气：连这都干得出，它还背着我们干过什么？

来自主题: AI资讯

10742 点击 2026-06-18 15:06

半月内两次问鼎全球：中国创业公司，在AI图像生成赛道掀了桌子

每一次技术范式的重大转换，都是旧秩序松动、新物种诞生的窗口期。

来自主题: AI资讯

10578 点击 2026-06-11 15:00

HiDream-O1-Image-1.5 刷新国产图像生成模型纪录：砍掉 VAE，是图像模型的未来吗？

文生图的"慢思考"，到底有没有用？

来自主题: AI资讯

9532 点击 2026-06-11 10:41

文生图开源第一易主，但 HiDream-O1-Image 为什么褒贬不一？

UiT 架构探路者，底牌还没亮。

来自主题: AI资讯

12455 点击 2026-06-02 15:05

智象未来超两千亿参数图像大模型HiDream-O1-Image-Pro发布，融资持续提速

智象未来正式发布基于新一代原生全模态模型架构 Unified Transformer（UiT）打造的图像大模型 HiDream-O1-Image-Pro。这一超2千亿参数的原生全模态图像大模型，不仅在多个基准测试中刷新 SOTA 纪录，也标志着智象未来正向图像、视频、文本、音频等多模态统一建模的“原生全模态”阶段迈进。

来自主题: AI资讯

9728 点击 2026-05-25 09:49

大模型也会想太多？清华等提出TaH：跳过93%无效迭代，准确率反而提升

随着 o1/R1 等推理模型的发展 [1][2]，「让模型多想一会儿」几乎成了提升复杂推理能力的标准方案。更长的 Chain-of-Thought、更大的测试时计算、更深的内部推理，都在用更多计算换取更可靠的答案。

来自主题: AI技术研报

8542 点击 2026-05-22 08:44

最早做文生视频的人，开始构建世界

走进智象未来合肥的办公室，首先映入眼帘的是一面员工照片墙。所有头像，都是AIGC生成的动漫风格。这家公司的核心业务是图像和视频生成——AI时代的自己，是他们在智象未来的第一课。

来自主题: AI资讯

11140 点击 2026-05-17 15:08