AI资讯新闻榜单内容搜索-模型训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型训练
ICML 2026 | 华为GTS提出AI训练数据新方法,Amazon/Google作者团队「光速跟进」:难度自适应训练正在成为新范式

ICML 2026 | 华为GTS提出AI训练数据新方法,Amazon/Google作者团队「光速跟进」:难度自适应训练正在成为新范式

ICML 2026 | 华为GTS提出AI训练数据新方法,Amazon/Google作者团队「光速跟进」:难度自适应训练正在成为新范式

在大模型后训练中,数据不再只是 “越多越好”,而是要像人类学习一样,动态选择最合适难度的样本。华为提出的 EDCO 方法,将样本难度估计与动态课程编排引入领域大模型微调;数月后,由 Rutgers、Amazon、Google 等作者参与的 DARE 论文即引用 EDCO,并将其作为难度感知强化学习训练的重要对比基线。

来自主题: AI技术研报
5304 点击    2026-05-18 15:29
DAG革新时间序列预测,代码、数据、排行榜全开源 | ICML'26

DAG革新时间序列预测,代码、数据、排行榜全开源 | ICML'26

DAG革新时间序列预测,代码、数据、排行榜全开源 | ICML'26

DAG框架利用时间与通道双重相关网络,有效整合历史与未来外生变量信息,提升时间序列预测准确性。通过发现并注入相关关系,充分利用未来协变量,显著优于现有方法。

来自主题: AI技术研报
6735 点击    2026-05-18 15:28
ICML 2026 |让大模型边想边说:这篇文章把「何时开口」变成可学习策略

ICML 2026 |让大模型边想边说:这篇文章把「何时开口」变成可学习策略

ICML 2026 |让大模型边想边说:这篇文章把「何时开口」变成可学习策略

用过推理型大模型的人,大概率都熟悉这种体验:模型似乎在认真思考,但屏幕上长时间没有真正有用的内容;如果让它一开始就输出,又很容易出现仓促判断,后面的推理还要被早期错误牵着走。

来自主题: AI技术研报
9527 点击    2026-05-18 15:27
Agent Skills的表示、获取、检索和进化看这一篇综述就清楚了|香港中文大学最新

Agent Skills的表示、获取、检索和进化看这一篇综述就清楚了|香港中文大学最新

Agent Skills的表示、获取、检索和进化看这一篇综述就清楚了|香港中文大学最新

早在2024年,人们还倾向于给Agent提供海量的工具(例如通过MCP协议连接的API、搜索引擎、代码解释器等)。但是,“拥有工具”并不等于“知道如何使用工具”。当任务变得复杂且长周期时,要求Agent每次都从头开始推理“该用哪个工具、何时用、怎么组合、出错怎么办”,会导致系统极度脆弱、延迟极高且不可靠。

来自主题: AI技术研报
6284 点击    2026-05-18 09:55
当SFT遇上RL:基于样本学习阶段的动态策略优化机制

当SFT遇上RL:基于样本学习阶段的动态策略优化机制

当SFT遇上RL:基于样本学习阶段的动态策略优化机制

过去一段时间里,在围绕大模型推理能力增强的研究中,SFT 和 RL 是两类核心后训练范式 —— 前者稳定收敛快,能高效吸收高质量推理数据;后者更具探索性,有望推动模型实现复杂推理和分布外泛化。

来自主题: AI技术研报
6564 点击    2026-05-18 09:53
Z Tech|一个词就能视觉推理?Meta 华人颠覆性提出 ATLAS 新范式

Z Tech|一个词就能视觉推理?Meta 华人颠覆性提出 ATLAS 新范式

Z Tech|一个词就能视觉推理?Meta 华人颠覆性提出 ATLAS 新范式

近日,Meta AI 与香港中文大学颠覆性提出了一种全新的视觉推理范式 ATLAS,不用外部工具,不显式生成中间图像,没有视觉监督信号,只用一个离散 word,首次颠覆性地代替 Agentic 和 Latent Visual Reasoning。

来自主题: AI技术研报
7422 点击    2026-05-17 15:07
扩散模型也有「Skills」了!魔搭开源11个现成模板,风格、修图、超清一键搞定

扩散模型也有「Skills」了!魔搭开源11个现成模板,风格、修图、超清一键搞定

扩散模型也有「Skills」了!魔搭开源11个现成模板,风格、修图、超清一键搞定

近期,专为Diffusion模型设计的插件框架——Diffusion Templates正式开源发布。这个框架能大幅降低可控生成技术的训练和使用难度,让开发者能够通过丰富的Templates来精准控制模型的生成结果。

来自主题: AI技术研报
7562 点击    2026-05-17 11:14
8B模型做生物实验:实验步骤顺序不乱、剂量无幻觉|ICLR 2026

8B模型做生物实验:实验步骤顺序不乱、剂量无幻觉|ICLR 2026

8B模型做生物实验:实验步骤顺序不乱、剂量无幻觉|ICLR 2026

针对这一问题,上海人工智能实验室、复旦大学、上海交通大学团队提出了Thoth:一个面向生物实验protocol生成的科学推理模型。一句话概括:Thoth不是让模型“写得像protocol”,而是让模型按照实验逻辑,生成可解析、可评估、可执行的protocol。

来自主题: AI技术研报
7840 点击    2026-05-17 10:52
解决视频生成穿帮问题!浙大&微软3000条纯文本让模型理解3D

解决视频生成穿帮问题!浙大&微软3000条纯文本让模型理解3D

解决视频生成穿帮问题!浙大&微软3000条纯文本让模型理解3D

浙大联合微软亚洲研究院最新提出的World-R1,不改架构、不要3D数据,纯靠强化学习就让视频生成模型学会了“理解”三维世界。World-R1 的出发点很简单:预训练的视频模型里面已经有 3D 知识了,只是“沉睡”着。用强化学习把它叫醒就行。

来自主题: AI技术研报
8441 点击    2026-05-16 13:34