腾讯混元最新开源:一套RL框架打通多个模态,庞天宇团队新作
腾讯混元最新开源:一套RL框架打通多个模态,庞天宇团队新作大语言模型的RL技术已日趋成熟,多模态生成模型的强化学习训练却仍在“各自为战”——图像扩散模型一套流程、视频生成另一套标准、VLM和LLM又有不同的技术栈。
来自主题: AI技术研报
6714 点击 2026-06-18 11:25
搜索
大语言模型的RL技术已日趋成熟,多模态生成模型的强化学习训练却仍在“各自为战”——图像扩散模型一套流程、视频生成另一套标准、VLM和LLM又有不同的技术栈。