AI资讯新闻榜单内容搜索-模型训练

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 模型训练

MSRA首测AI从零建仓库：能写、能跑，但不一定对丨ACL'26

MSRA首测AI从零建仓库：能写、能跑，但不一定对丨ACL'26

MSRA首测AI从零建仓库：能写、能跑，但不一定对丨ACL'26

大模型写代码这件事，越来越像「既能写片段，又离真实工程差一截」。

来自主题: AI技术研报

6971 点击 2026-04-16 16:07

训练提速4.6倍！FP4+BF16双轨并行，NVIDIA×港大×MIT联手重新定义扩散模型训练速度上限

训练提速4.6倍！FP4+BF16双轨并行，NVIDIA×港大×MIT联手重新定义扩散模型训练速度上限

训练提速4.6倍！FP4+BF16双轨并行，NVIDIA×港大×MIT联手重新定义扩散模型训练速度上限

当强化学习后训练的大规模 rollout 已经被证明能够提升图像生成模型的偏好对齐能力，推理负担就成了制约训练速度的核心瓶颈。来自 NVIDIA、港大和 MIT 的团队提出的 Sol-RL，通过「FP4 先探索、BF16 再训练」的后训练框架，将达到等效 reward 水平的收敛速度最高提升到 4.64x，在训练速度与对齐效果之间给出了一条更具工程可行性的解法。

来自主题: AI技术研报

9576 点击 2026-04-16 16:07

合成数据≠生成模型：一文读懂合成数据的全新范式

合成数据≠生成模型：一文读懂合成数据的全新范式

合成数据≠生成模型：一文读懂合成数据的全新范式

最新研究提出合成数据的全新分类框架，突破「生成模型=合成数据」的传统认知，涵盖反演、仿真与数据增强等方法，并按应用层次划分为数据中心AI、模型中心AI、可信AI和具身AI。

来自主题: AI技术研报

6744 点击 2026-04-16 16:06

三省六部幻觉：为什么"虚拟公司"式多 Agent 架构在工程上不成立

三省六部幻觉：为什么"虚拟公司"式多 Agent 架构在工程上不成立

三省六部幻觉：为什么"虚拟公司"式多 Agent 架构在工程上不成立

一个在 AI 社区广泛流传的架构思路，正在让大量团队走弯路。

来自主题: AI技术研报

6296 点击 2026-04-16 12:30

速递丨Hermes 抄袭Evolver：万字技术博客对比实锤

速递丨Hermes 抄袭Evolver：万字技术博客对比实锤

速递丨Hermes 抄袭Evolver：万字技术博客对比实锤

Hermes Agent最近在AI圈彻底火了。

来自主题: AI技术研报

6650 点击 2026-04-16 12:25

从「片段生成」到「长视频漫游」：OmniRoam探索轨迹可控的长视频生成新范式

从「片段生成」到「长视频漫游」：OmniRoam探索轨迹可控的长视频生成新范式

从「片段生成」到「长视频漫游」：OmniRoam探索轨迹可控的长视频生成新范式

在生成式视频快速发展的今天，模型已经能够生成高质量的短视频片段，但一个更具挑战性的问题正逐渐成为研究焦点：

来自主题: AI技术研报

8632 点击 2026-04-16 11:17

15个前沿大模型，100个职业场景：谁才是最强AI打工人？

15个前沿大模型，100个职业场景：谁才是最强AI打工人？

15个前沿大模型，100个职业场景：谁才是最强AI打工人？

当大模型训练进入深水区，竞争的关键已经不再只是「模型参数怎么调」，而逐渐转向一个更核心、也更难系统解决的问题：模型在训练过程中究竟看到了什么数据、以什么比例看到、哪些样本应该被更频繁地学习。

来自主题: AI资讯

8994 点击 2026-04-16 11:16

北大联合Llama-Factory推出DataFlex：工业级数据动态训练系统

北大联合Llama-Factory推出DataFlex：工业级数据动态训练系统

北大联合Llama-Factory推出DataFlex：工业级数据动态训练系统

当大模型训练进入深水区，竞争的关键已经不再只是「模型参数怎么调」，而逐渐转向一个更核心、也更难系统解决的问题：模型在训练过程中究竟看到了什么数据、以什么比例看到、哪些样本应该被更频繁地学习。

来自主题: AI技术研报

7246 点击 2026-04-16 11:16

拟态共情上瘾：为什么我们宁愿向AI求救，也不愿找真人倾诉？

拟态共情上瘾：为什么我们宁愿向AI求救，也不愿找真人倾诉？

拟态共情上瘾：为什么我们宁愿向AI求救，也不愿找真人倾诉？

今天这个世界，正在不断放大一种渴望：人们愈发渴望被另一个人真正看见。而这，恰恰是AI治疗师永远无法给予的。

来自主题: AI资讯

9574 点击 2026-04-15 14:17

柔体操作最缺数据、最怕仿真失真？新研究让布料物理真实再现

柔体操作最缺数据、最怕仿真失真？新研究让布料物理真实再现

柔体操作最缺数据、最怕仿真失真？新研究让布料物理真实再现

近年来研究者们一直在试图通过仿真环境批量产出具身训练数据。

来自主题: AI技术研报

7081 点击 2026-04-15 14:17

上一页当前第53页,共430页下一页