
1句话高质量生成游戏3D动作,北大新方法刷新动画制作SOTA
1句话高质量生成游戏3D动作,北大新方法刷新动画制作SOTA北京大学提出了ReMoMask:一种全新的基于检索增强生成的Text-to-Motion框架。它是一个集成三项关键创新的统一框架:(1)基于动量的双向文本-动作模型,通过动量队列将负样本的尺度与批次大小解耦,显著提高了跨模态检索精度;(2)语义时空注意力机制,在部件级融合过程中强制执行生物力学约束,消除异步伪影;(3)RAG-无分类器引导结合轻微的无条件生成以增强泛化能力。
来自主题: AI技术研报
7010 点击 2025-08-09 11:32