AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
7B模型“情商”比肩GPT-4o,腾讯突破开放域RL难题,得分直翻5倍

7B模型“情商”比肩GPT-4o,腾讯突破开放域RL难题,得分直翻5倍

7B模型“情商”比肩GPT-4o,腾讯突破开放域RL难题,得分直翻5倍

在没有标准答案的开放式对话中,RL该怎么做?多轮对话是大模型最典型的开放任务:高频、多轮、强情境依赖,且“好回复”因人而异。

来自主题: AI技术研报
6831 点击    2025-07-19 11:13
Manus 内部的 Context 工程经验(精校、高亮要点)

Manus 内部的 Context 工程经验(精校、高亮要点)

Manus 内部的 Context 工程经验(精校、高亮要点)

Manus 团队刚分享了他们构建 Agent 的 Context 工程经验。刚好我在自己读的过程中,对全文进行了精校翻译,并高亮要点与排版。来自一线的分享,总共 6 条经验,共 5K 字。

来自主题: AI技术研报
8379 点击    2025-07-19 11:07
突破户外RGB-only SLAM尺度漂移难题,精确定位+高保真重建 | ICCV'25开源

突破户外RGB-only SLAM尺度漂移难题,精确定位+高保真重建 | ICCV'25开源

突破户外RGB-only SLAM尺度漂移难题,精确定位+高保真重建 | ICCV'25开源

户外SLAM的尺度漂移问题,终于有了新解法! 香港科技大学(广州)的研究的最新成果:S3PO-GS,一个专门针对户外单目SLAM的3D高斯框架,已被ICCV 2025接收。

来自主题: AI技术研报
6198 点击    2025-07-19 10:59
AI for Chemistry进入「配置即代码」时代,Chemia一键训练化学AI模型

AI for Chemistry进入「配置即代码」时代,Chemia一键训练化学AI模型

AI for Chemistry进入「配置即代码」时代,Chemia一键训练化学AI模型

如今,人工智能已成为化学研究不可或缺的工具,广泛应用于化合物性质预测、反应优化和材料设计等领域。

来自主题: AI资讯
6077 点击    2025-07-18 17:20
强化学习的两个「大坑」,终于被两篇ICLR论文给解决了

强化学习的两个「大坑」,终于被两篇ICLR论文给解决了

强化学习的两个「大坑」,终于被两篇ICLR论文给解决了

实时强化学习来了!AI 再也不怕「卡顿」。 设想这样一个未来场景:多个厨师机器人正在协作制作煎蛋卷。

来自主题: AI技术研报
8072 点击    2025-07-18 14:06
广义智能体理论:智能时代通向「万物理论」的新路径?

广义智能体理论:智能时代通向「万物理论」的新路径?

广义智能体理论:智能时代通向「万物理论」的新路径?

一个源自AI的「广义智能体理论」,为探索「万物理论」开了个新脑洞。它认为,无论是物理系统、生命还是AI,本质上都是「智能体」。

来自主题: AI资讯
7642 点击    2025-07-18 13:52
大模型转行土木工程!首个「打灰人」评估基准:检验读、改工程图纸能力

大模型转行土木工程!首个「打灰人」评估基准:检验读、改工程图纸能力

大模型转行土木工程!首个「打灰人」评估基准:检验读、改工程图纸能力

首个工程自动化任务评估基准DrafterBench,可用于测试大语言模型在土木工程图纸修改任务中的表现。通过模拟真实工程命令,全面考察模型的结构化数据理解、工具调用、指令跟随和批判性推理能力,研究结果发现当前主流大模型虽有一定能力,但整体水平仍不足以满足工程一线需求。

来自主题: AI技术研报
6030 点击    2025-07-18 12:58
「有望成为Transformer杀手」,谷歌DeepMind新架构MoR实现两倍推理速度

「有望成为Transformer杀手」,谷歌DeepMind新架构MoR实现两倍推理速度

「有望成为Transformer杀手」,谷歌DeepMind新架构MoR实现两倍推理速度

大型语言模型已展现出卓越的能力,但其部署仍面临巨大的计算与内存开销所带来的挑战。随着模型参数规模扩大至数千亿级别,训练和推理的成本变得高昂,阻碍了其在许多实际应用中的推广与落地。

来自主题: AI技术研报
5912 点击    2025-07-18 11:58
免剪辑直出!AI生成多角色同框对话视频,动态路由精准绑定音频

免剪辑直出!AI生成多角色同框对话视频,动态路由精准绑定音频

免剪辑直出!AI生成多角色同框对话视频,动态路由精准绑定音频

Bind-Your-Avatar是一个基于扩散Transformer(MM-DiT)的框架,通过细粒度嵌入路由将语音与角色绑定,实现精准的音画同步,并支持动态背景生成。该框架还引入了首个针对多角色对话视频生成的数据集MTCC和基准测试,实验表明其在身份保真和音画同步上优于现有方法。

来自主题: AI技术研报
6536 点击    2025-07-18 11:44
AI编程,LLM会写代码,但“不懂”代码,来自两篇顶级研究的“人机协作避坑指南”

AI编程,LLM会写代码,但“不懂”代码,来自两篇顶级研究的“人机协作避坑指南”

AI编程,LLM会写代码,但“不懂”代码,来自两篇顶级研究的“人机协作避坑指南”

从Cursor到Claude Code和最近很火的Kiro,AI编程能在几秒钟内生成完整的函数,但它真的理解代码在做什么吗?最近两项突破性研究发现了一个让人意外的结果:现在的AI虽然"会写",但还远没有"真懂"。

来自主题: AI技术研报
7869 点击    2025-07-18 11:24