AI资讯新闻榜单内容搜索-训练

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 训练
训练提速4.6倍!FP4+BF16双轨并行,NVIDIA×港大×MIT联手重新定义扩散模型训练速度上限

训练提速4.6倍!FP4+BF16双轨并行,NVIDIA×港大×MIT联手重新定义扩散模型训练速度上限

训练提速4.6倍!FP4+BF16双轨并行,NVIDIA×港大×MIT联手重新定义扩散模型训练速度上限

当强化学习后训练的大规模 rollout 已经被证明能够提升图像生成模型的偏好对齐能力,推理负担就成了制约训练速度的核心瓶颈。来自 NVIDIA、港大和 MIT 的团队提出的 Sol-RL,通过「FP4 先探索、BF16 再训练」的后训练框架,将达到等效 reward 水平的收敛速度最高提升到 4.64x,在训练速度与对齐效果之间给出了一条更具工程可行性的解法。

来自主题: AI技术研报
8842 点击    2026-04-16 16:07
合成数据≠生成模型:一文读懂合成数据的全新范式

合成数据≠生成模型:一文读懂合成数据的全新范式

合成数据≠生成模型:一文读懂合成数据的全新范式

最新研究提出合成数据的全新分类框架,突破「生成模型=合成数据」的传统认知,涵盖反演、仿真与数据增强等方法,并按应用层次划分为数据中心AI、模型中心AI、可信AI和具身AI。

来自主题: AI技术研报
6247 点击    2026-04-16 16:06
15个前沿大模型,100个职业场景:谁才是最强AI打工人?

15个前沿大模型,100个职业场景:谁才是最强AI打工人?

15个前沿大模型,100个职业场景:谁才是最强AI打工人?

当大模型训练进入深水区,竞争的关键已经不再只是「模型参数怎么调」,而逐渐转向一个更核心、也更难系统解决的问题:模型在训练过程中究竟看到了什么数据、以什么比例看到、哪些样本应该被更频繁地学习。

来自主题: AI资讯
8464 点击    2026-04-16 11:16
北大联合Llama-Factory推出DataFlex:工业级数据动态训练系统

北大联合Llama-Factory推出DataFlex:工业级数据动态训练系统

北大联合Llama-Factory推出DataFlex:工业级数据动态训练系统

当大模型训练进入深水区,竞争的关键已经不再只是「模型参数怎么调」,而逐渐转向一个更核心、也更难系统解决的问题:模型在训练过程中究竟看到了什么数据、以什么比例看到、哪些样本应该被更频繁地学习。

来自主题: AI技术研报
6512 点击    2026-04-16 11:16
拟态共情上瘾:为什么我们宁愿向AI求救,也不愿找真人倾诉?

拟态共情上瘾:为什么我们宁愿向AI求救,也不愿找真人倾诉?

拟态共情上瘾:为什么我们宁愿向AI求救,也不愿找真人倾诉?

今天这个世界,正在不断放大一种渴望:人们愈发渴望被另一个人真正看见。而这,恰恰是AI治疗师永远无法给予的。

来自主题: AI资讯
9143 点击    2026-04-15 14:17