AI资讯新闻榜单内容搜索-语音对话模型

让大模型能听会说，国内机构开源全球首个端到端语音对话模型Mini-Omni

本文出自启元世界多模态算法组，共同一作是来自清华大学的一年级硕士生谢之非与启元世界多模态负责人吴昌桥，研究兴趣为多模态大模型、LLM Agents 等。本论文上线几天内在 github 上斩获 1000+ 星标。

来自主题: AI技术研报

8712 点击 2024-09-07 11:04