AI资讯新闻榜单内容搜索-模型训练

7B模型“情商”比肩GPT-4o，腾讯突破开放域RL难题，得分直翻5倍

在没有标准答案的开放式对话中，RL该怎么做？多轮对话是大模型最典型的开放任务：高频、多轮、强情境依赖，且“好回复”因人而异。

来自主题: AI技术研报

6831 点击 2025-07-19 11:13

Manus 团队刚分享了他们构建 Agent 的 Context 工程经验。刚好我在自己读的过程中，对全文进行了精校翻译，并高亮要点与排版。来自一线的分享，总共 6 条经验，共 5K 字。

来自主题: AI技术研报

8379 点击 2025-07-19 11:07

户外SLAM的尺度漂移问题，终于有了新解法！香港科技大学（广州）的研究的最新成果：S3PO-GS，一个专门针对户外单目SLAM的3D高斯框架，已被ICCV 2025接收。

来自主题: AI技术研报

6198 点击 2025-07-19 10:59

如今，人工智能已成为化学研究不可或缺的工具，广泛应用于化合物性质预测、反应优化和材料设计等领域。

来自主题: AI资讯

6077 点击 2025-07-18 17:20

实时强化学习来了！AI 再也不怕「卡顿」。设想这样一个未来场景：多个厨师机器人正在协作制作煎蛋卷。

来自主题: AI技术研报

8072 点击 2025-07-18 14:06

一个源自AI的「广义智能体理论」，为探索「万物理论」开了个新脑洞。它认为，无论是物理系统、生命还是AI，本质上都是「智能体」。

来自主题: AI资讯

7642 点击 2025-07-18 13:52

首个工程自动化任务评估基准DrafterBench，可用于测试大语言模型在土木工程图纸修改任务中的表现。通过模拟真实工程命令，全面考察模型的结构化数据理解、工具调用、指令跟随和批判性推理能力，研究结果发现当前主流大模型虽有一定能力，但整体水平仍不足以满足工程一线需求。

来自主题: AI技术研报

6030 点击 2025-07-18 12:58

大型语言模型已展现出卓越的能力，但其部署仍面临巨大的计算与内存开销所带来的挑战。随着模型参数规模扩大至数千亿级别，训练和推理的成本变得高昂，阻碍了其在许多实际应用中的推广与落地。

来自主题: AI技术研报

5912 点击 2025-07-18 11:58

Bind-Your-Avatar是一个基于扩散Transformer（MM-DiT）的框架，通过细粒度嵌入路由将语音与角色绑定，实现精准的音画同步，并支持动态背景生成。该框架还引入了首个针对多角色对话视频生成的数据集MTCC和基准测试，实验表明其在身份保真和音画同步上优于现有方法。

来自主题: AI技术研报

6536 点击 2025-07-18 11:44

从Cursor到Claude Code和最近很火的Kiro，AI编程能在几秒钟内生成完整的函数，但它真的理解代码在做什么吗？最近两项突破性研究发现了一个让人意外的结果：现在的AI虽然"会写"，但还远没有"真懂"。

来自主题: AI技术研报

7869 点击 2025-07-18 11:24