AI资讯新闻榜单内容搜索-训练

Meta新注意力机制突破Transformer上限，还用上了OpenAI的开源技术

Meta挖走OpenAI大批员工后，又用OpenAI的技术搞出新突破。新架构名为2-Simplicial Transformer，重点是通过修改标准注意力，让Transformer能更高效地利用训练数据，以突破当前大模型发展的数据瓶颈。

来自主题: AI技术研报

5862 点击 2025-07-08 12:01

上交研究登Nature大子刊！可微分物理首次突破端到端无人机高速避障

上海交通大学研究团队提出了一种融合无人机物理建模与深度学习的端到端方法，该研究首次将可微分物理训练的策略成功部署到现实机器人中，实现了无人机集群自主导航，并在鲁棒性、机动性上大幅领先现有的方案。

来自主题: AI技术研报

6505 点击 2025-07-08 11:54

AI视频生成革命！MIT领衔豪华天团让生成效率暴涨370%，成本直降4.4倍

刷到1分钟AI短视频别只顾着点赞，背后的算力成本让人惊叹。MIT和英伟达等提出的径向注意力技术让长视频生成成本暴降4.4倍，速度飙升3.7倍，AI视频的未来已来！

来自主题: AI技术研报

6456 点击 2025-07-08 11:40

RoboTwin系列新作：开源大规模域随机化双臂操作数据合成器与评测基准集

最近，上海交通大学 ScaleLab 与香港大学 MMLab@HKU 领衔发布 RoboTwin 系列新作 RoboTwin 2.0 以及基于 RoboTwin 仿真平台在 CVPR 上举办的双臂协作竞赛 Technical Report。

来自主题: AI技术研报

5921 点击 2025-07-08 11:18

刷新复杂Agent推理记录！阿里通义开源网络智能体超越DeepSeek R1，Grok-3

在互联网信息检索任务中，即使是很强的LLM，有时也会陷入“信息迷雾”之中：当问题简单、路径明确时，模型往往能利用记忆或一两次搜索就找到答案；但面对高度不确定、线索模糊的问题，模型就很难做对。

来自主题: AI技术研报

5973 点击 2025-07-08 11:05

用子模优化法为DeepResearch生成多样性查询

在开发DeepResearch时，生成多样化的查询 (query) 是一个关键细节。我们在开发时会在至少两处遇到这个问题。

来自主题: AI技术研报

8032 点击 2025-07-07 15:25

重塑AI记忆边界：MemOS开源！时序推理较OpenAI提升159%

大模型记忆管理和优化框架是当前各大厂商争相优化的热点方向，MemOS 相比现有 OpenAI 的全局记忆在大模型记忆评测集上呈现出显著的提升，平均准确性提升超过 38.97%，Tokens 的开销进一步降低 60.95%，一举登顶记忆管理的 SOTA 框架，特别是在考验框架时序建模与检索能力的时序推理任务上，提升比例更是达到了 159%，相当震撼！

来自主题: AI技术研报

6953 点击 2025-07-07 14:44

Stream-Omni：同时支持各种模态组合交互的文本-视觉-语音多模态大模型

来自主题: AI技术研报

8004 点击 2025-07-07 14:19

新范式来了！新能量模型打破Transformer++扩展上限，训练扩展率快35%

是否可以在不依赖额外监督的前提下，仅通过无监督学习让模型学会思考？答案有了。

来自主题: AI技术研报

7793 点击 2025-07-07 13:54

复杂空间指令也能秒懂？RoboRefer 让机器人理解推理空间，开放世界也能精准行动！

机器人走出实验室、进入真实世界真正可用，远比想象中更复杂。现实环境常常杂乱无序、物体种类繁多、灵活多变，远不像实验室那样干净、单一、可控。

来自主题: AI技术研报

8930 点击 2025-07-07 11:46