AI资讯新闻榜单内容搜索-训练

2D图像作中介，零训练实现3D场景生成SOTA：英伟达&康奈尔提出文本驱动新流程

想象一下，你是一位游戏设计师，正在为一个奇幻 RPG 游戏搭建场景。你需要创建一个 "精灵族树屋村落"—— 参天古木和树屋、发光的蘑菇路灯、半透明的纱幔帐篷... 传统工作流程中，这可能需要数周时间：先手工建模每个 3D 资产，再逐个调整位置和材质，最后反复测试光照效果…… 总之就是一个字，难。

来自主题: AI技术研报

7403 点击 2025-06-12 17:09

通义实验室最新成果WebDancer：开启自主智能Deep Research的新时代

作者介绍：本文作者来自通义实验室 RAG 团队，致力于面向下一代 RAG 技术进行基础研究。该团队 WebWalker 工作近期也被 ACL 2025 main conference 录用。

来自主题: AI技术研报

6174 点击 2025-06-12 15:24

每秒生成超30帧视频，支持实时交互！自回归视频生成新框架刷新生成效率

在A100上用310M模型，实现每秒超30帧自回归视频生成，同时画面还保持高质量！

来自主题: AI技术研报

8397 点击 2025-06-12 12:42

端到端GUI智能体首次实现“犯错-反思-修正”闭环，模拟人类认知全过程

端到端多模态GUI智能体有了“自我反思”能力！南洋理工大学MMLab团队提出框架GUI-Reflection。

来自主题: AI技术研报

8622 点击 2025-06-12 12:11

别再信“LRM无需优化提示词”了，你至少输掉23%的性能，以R1为例

还记得DeepSeek-R1发布时AI圈的那波狂欢吗？"提示工程已死"、"再也不用费心写复杂提示了"、"推理模型已经聪明到不再需要学习提示词了"......这些观点在社交媒体上刷屏，连不少技术大佬都在转发。再到最近，“提示词写死了”......现实总是来得这么快——乔治梅森大学的研究者们用一个严谨得让人无法反驳的实验，狠狠打了所有人的脸！

来自主题: AI技术研报

7120 点击 2025-06-12 11:59