两个多月前那个对标GPT-4o的端到端语音模型,终于开源了。大神Karpathy体验之后表示:nice!
来自主题: AI技术研报
4724 点击 2024-09-24 12:07
两个多月前那个对标GPT-4o的端到端语音模型,终于开源了。大神Karpathy体验之后表示:nice!
大神Karpathy鼎力推荐,开源版「Her」Moshi再引关注!
最近,一个对标 GPT-4o 的开源实时语音多模态模型火了。
Moshi 具有彻底改变人机通信的潜力。
GPT-4o或许还得等到今年秋季才对外开放。不过,由法国8人团队打造的原生多模态Moshi,已经实现了接近GPT-4o的水平,现场演示几乎0延迟,AI大佬纷纷转发。