AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
把Agent丢入1000+文件:人大CoDA-Bench揭示Code Agent瓶颈

把Agent丢入1000+文件:人大CoDA-Bench揭示Code Agent瓶颈

把Agent丢入1000+文件:人大CoDA-Bench揭示Code Agent瓶颈

中国人民大学的研究团队提出 CoDA-Bench,联合评估 Agent 的 Code Intelligence + Data Intelligence。该基准首次把 Code Agent 放进包含 1000 + 数据文件的复杂环境下,要求模型先自主探索文件系统、找到相关数据,再编写代码完成分析。实验显示,即使当前表现最好的系统,在 CoDA-Bench 上执行准确率也只有 61.1%;

来自主题: AI技术研报
8941 点击    2026-07-04 10:51
ECCV 2026 | 悉尼大学提出Linstereo, 打通立体匹配「最后一公里」

ECCV 2026 | 悉尼大学提出Linstereo, 打通立体匹配「最后一公里」

ECCV 2026 | 悉尼大学提出Linstereo, 打通立体匹配「最后一公里」

LinStereo 对应地做了三件事:PALA 换掉 ConvGRU 解决传播问题,HSCV 保留多尺度特征,DPI 用单目深度给一个靠谱的起点。PALA 做的事情说起来很直观,就是把 ConvGRU 的局部更新换成全局注意力,让每个像素每次迭代都能看到整张图。难点在于 softmax attention 是 O (N²) 的,直接用在高分辨率视差图上跑不动。

来自主题: AI技术研报
8125 点击    2026-07-04 10:50
AI Agent为什么总是不稳定?终于有了一个系统性基准来拆解

AI Agent为什么总是不稳定?终于有了一个系统性基准来拆解

AI Agent为什么总是不稳定?终于有了一个系统性基准来拆解

三星大模型团队联合北京大学、香港城市大学、香港科技大学等科研机构,共同发布了面向 AI Agent 的基准测试 LiveClawBench。它关注的并不是「谁的 Agent 更强」,而是一个更基础、也更关键的问题:为什么同一个 AI Agent,在一些任务中已经接近可用,而在另一些任务中却会突然失稳?

来自主题: AI技术研报
7142 点击    2026-07-04 10:50
只用15%数据,多模态指令微调反超全量训练15.8%!

只用15%数据,多模态指令微调反超全量训练15.8%!

只用15%数据,多模态指令微调反超全量训练15.8%!

来自上海交大、马来亚大学、CMU、MBZUAI、KIT和KAUST的团队提出VisNec(Visual Necessity Score,视觉必要性分数),用一个分数衡量每条训练样本里“图像到底起了多大作用”,被ECCV 2026收录。

来自主题: AI技术研报
7625 点击    2026-07-04 10:47
刚刚,LeCun团队让世界模型学会持续学习!

刚刚,LeCun团队让世界模型学会持续学习!

刚刚,LeCun团队让世界模型学会持续学习!

刚刚,纽约大学联合LeCun初创AMI带来JEPA系列的最新成果——AdaJEPA。与过去在预训练结束后就冻结参数的世界模型不同,AdaJEPA能够在与环境交互中,基于测试时自适应(Test-Time Adaptation, TTA),实时调整世界模型的编码器和预测器参数,从而实现持续学习。

来自主题: AI技术研报
9166 点击    2026-07-03 16:12
李飞飞署名具身新论文:Sim2Real烧不起,Real2Sim量大管饱

李飞飞署名具身新论文:Sim2Real烧不起,Real2Sim量大管饱

李飞飞署名具身新论文:Sim2Real烧不起,Real2Sim量大管饱

还在聊Sim2Real?现在机器人圈更火的是Real2Sim!最近,英伟达GEAR联合李飞飞团队、佐治亚理工大学等机构联合发布全新Real2Sim系统——SimFoundry。SimFoundry只需一段真实世界视频,就能自动生成一个可以交互、训练、评测的机器人仿真环境。

来自主题: AI技术研报
8445 点击    2026-07-03 16:11
世界模型的新用途:不做选手,去当裁判

世界模型的新用途:不做选手,去当裁判

世界模型的新用途:不做选手,去当裁判

眼下具身赛道都在卷世界模型,都在抢着做机器人的“大脑”。

来自主题: AI技术研报
7906 点击    2026-07-03 10:10
怎么量化机器人数据价值?ATHENA将影响函数扩展到十亿参数VLA,313×加速筛选高价值数据

怎么量化机器人数据价值?ATHENA将影响函数扩展到十亿参数VLA,313×加速筛选高价值数据

怎么量化机器人数据价值?ATHENA将影响函数扩展到十亿参数VLA,313×加速筛选高价值数据

具身智能正在进入数据 scaling 时代。Vision-Language-Action(VLA)模型让机器人可以从大规模示教数据(demonstrations)中学习更通用的操作策略。但对机器人 VLA 训练来说,数据并不总是越多越好:低质量数据可能会拖累模型性能,而每一条 demonstration 都意味着昂贵的人力采集、机器人运行,以及云端存储和训练成本。

来自主题: AI技术研报
9132 点击    2026-07-03 09:48