NIPS2025|小红书智创AIGC团队提出布局控制生成新算法InstanceAssemble
NIPS2025|小红书智创AIGC团队提出布局控制生成新算法InstanceAssemble当下的文本生成图像扩散模型取得了长足进展,为图像生成引入布局控制(Layout-to-Image, L2I)成为可能。
来自主题: AI技术研报
5507 点击 2025-11-04 11:33
当下的文本生成图像扩散模型取得了长足进展,为图像生成引入布局控制(Layout-to-Image, L2I)成为可能。
小红书智创音频团队推出业内首个支持私有化部署的全双工大模型语音交互系统 FireRedChat,自研流式 pVAD 与 EoT 让语音交互更加自然,首发级联与半级联两套实现,端到端时延逼近工业级应用。