AI资讯新闻榜单内容搜索-训练

AI视频生成革命！MIT领衔豪华天团让生成效率暴涨370%，成本直降4.4倍

刷到1分钟AI短视频别只顾着点赞，背后的算力成本让人惊叹。MIT和英伟达等提出的径向注意力技术让长视频生成成本暴降4.4倍，速度飙升3.7倍，AI视频的未来已来！

来自主题: AI技术研报

6421 点击 2025-07-08 11:40

RoboTwin系列新作：开源大规模域随机化双臂操作数据合成器与评测基准集

最近，上海交通大学 ScaleLab 与香港大学 MMLab@HKU 领衔发布 RoboTwin 系列新作 RoboTwin 2.0 以及基于 RoboTwin 仿真平台在 CVPR 上举办的双臂协作竞赛 Technical Report。

来自主题: AI技术研报

5862 点击 2025-07-08 11:18

刷新复杂Agent推理记录！阿里通义开源网络智能体超越DeepSeek R1，Grok-3

在互联网信息检索任务中，即使是很强的LLM，有时也会陷入“信息迷雾”之中：当问题简单、路径明确时，模型往往能利用记忆或一两次搜索就找到答案；但面对高度不确定、线索模糊的问题，模型就很难做对。

来自主题: AI技术研报

5932 点击 2025-07-08 11:05

用子模优化法为DeepResearch生成多样性查询

在开发DeepResearch时，生成多样化的查询 (query) 是一个关键细节。我们在开发时会在至少两处遇到这个问题。

来自主题: AI技术研报

7980 点击 2025-07-07 15:25

重塑AI记忆边界：MemOS开源！时序推理较OpenAI提升159%

大模型记忆管理和优化框架是当前各大厂商争相优化的热点方向，MemOS 相比现有 OpenAI 的全局记忆在大模型记忆评测集上呈现出显著的提升，平均准确性提升超过 38.97%，Tokens 的开销进一步降低 60.95%，一举登顶记忆管理的 SOTA 框架，特别是在考验框架时序建模与检索能力的时序推理任务上，提升比例更是达到了 159%，相当震撼！

来自主题: AI技术研报

6913 点击 2025-07-07 14:44

Stream-Omni：同时支持各种模态组合交互的文本-视觉-语音多模态大模型

来自主题: AI技术研报

7977 点击 2025-07-07 14:19

新范式来了！新能量模型打破Transformer++扩展上限，训练扩展率快35%

是否可以在不依赖额外监督的前提下，仅通过无监督学习让模型学会思考？答案有了。

来自主题: AI技术研报

7760 点击 2025-07-07 13:54

复杂空间指令也能秒懂？RoboRefer 让机器人理解推理空间，开放世界也能精准行动！

机器人走出实验室、进入真实世界真正可用，远比想象中更复杂。现实环境常常杂乱无序、物体种类繁多、灵活多变，远不像实验室那样干净、单一、可控。

来自主题: AI技术研报

8898 点击 2025-07-07 11:46

750城市+5000小时第一人称视频，上海AI Lab开源面向世界探索高质量视频数据集

现在，国内研究机构就从数据基石的角度出发，拿出了还原真实动态世界的新进展：上海人工智能实验室、北京理工大学、上海创智学院、东京大学等机构聚焦世界生成的第一步——世界探索，联合推出一个持续迭代的高质量视频数据集项目——Sekai（日语意为“世界”），服务于交互式视频生成、视觉导航、视频理解等任务，旨在利用图像、文本或视频构建一个动态且真实的世界，可供用户不受限制进行交互探索。

来自主题: AI技术研报

5984 点击 2025-07-07 11:22

Test Time Scaling Law远未达到上限! o4-mini仅15.8%通过率，华为诺亚提出代码HLCE终极基准

大语言模型（LLM）在标准编程基准测试（如 HumanEval,Livecodebench）上已经接近 “毕业”，但这是否意味着它们已经掌握了人类顶尖水平的复杂推理和编程能力？

来自主题: AI技术研报

6003 点击 2025-07-07 10:39