AI资讯新闻榜单内容搜索-训练

破解人机协作密码：工作技能拆成两层，AI执行人类决策成功率狂飙 | ICML 2025

人类和AI在工作中如何协作？耶鲁和南大的研究人员合作的这篇论文讲清楚了。这篇论文提出了一个数学框架，通过把工作技能拆分成两个层次来解释这个问题

来自主题: AI资讯

7555 点击 2025-08-27 17:42

Agentic Deep Research新范式，推理能力再突破，可信度增加，蚂蚁安全团队出品

尽管 LLM 的能力与日俱增，但其在复杂任务上的表现仍受限于静态的内部知识。为从根本上解决这一限制，突破 AI 能力界限，业界研究者们提出了 Agentic Deep Research 系统，在该系统中基于 LLM 的 Agent 通过自主推理、调用搜索引擎和迭代地整合信息来给出全面、有深度且正确性有保障的解决方案。

来自主题: AI技术研报

7668 点击 2025-08-27 17:05

教AI「择偶生娃」，复刻自然演化！上交校友提名最佳论文

Sakana AI以自然演化为灵感，提出了一种全新的模型融合进化方法M2N2。通过引入自然界的「择偶机制」，AI可以像生物一样「竞争、择偶、繁衍」。在当前全球算力短缺、模型训练实际规模受制的情况下，Sakana AI借助自然界的启示，为模型融合探索出了一条新路。

来自主题: AI技术研报

8845 点击 2025-08-27 12:29

英伟达再出手！新型混合架构模型问世，两大创新实现53.6倍吞吐提速

Transformer 架构对计算和内存的巨大需求使得大模型效率的提升成为一大难题。为应对这一挑战，研究者们投入了大量精力来设计更高效的 LM 架构。

来自主题: AI技术研报

7726 点击 2025-08-27 11:46

从需求分析到代码生成，LLM都能干点啥？一文读懂291个软工Benchmark！

大语言模型正加速重塑软件工程领域的各个环节，从需求分析到代码生成，再到自动化测试，几乎无所不能，但衡量这些模型到底「好不好用」、「好在哪里」、「还有哪些短板」，一直缺乏系统、权威的评估工具。

来自主题: AI技术研报

7675 点击 2025-08-27 11:42

搞不定有表格数据和多模态的Prompt？试下微软最新的提示词编排标记语言POML

最近来自微软的研究者们带来了一个全新的思路，他们开源发布了POML（Prompt Orchestration Markup Language），它的的解决方案它的核心思想非常直接：为什么我们不能像开发网页一样，用工程化的思维来构建和管理我们的Prompt呢？这个编排语言很类似IBM的PDL

来自主题: AI技术研报

8421 点击 2025-08-27 11:11

手把手教机器人：斯坦福大学提出RTR框架，让机械臂助力人形机器人真机训练

人形机器人的运动控制，正成为强化学习（RL）算法应用的下一个热点研究领域。当前，主流方案大多遵循 “仿真到现实”（Sim-to-Real）的范式。研究者们通过域随机化（Domain Randomization）技术，在成千上万个具有不同物理参数的仿真环境中训练通用控制模型，期望它能凭借强大的泛化能力，直接适应动力学特性未知的真实世界。

来自主题: AI技术研报

7959 点击 2025-08-27 11:05