最近,一个对标 GPT-4o 的开源实时语音多模态模型火了。
来自主题: AI资讯
7969 点击 2024-07-05 00:17
最近,一个对标 GPT-4o 的开源实时语音多模态模型火了。
GPT-4o或许还得等到今年秋季才对外开放。不过,由法国8人团队打造的原生多模态Moshi,已经实现了接近GPT-4o的水平,现场演示几乎0延迟,AI大佬纷纷转发。
马斯克连回两条推文为xAI造势,宣布8月发布Grok 2,年底将推出在10万张H100上训练的Grok 3,芯片加持创新数据训练,打造对标GPT的新一代大语言模型。
OpenAI不再Open,有意为之还是无奈之举?
或许只有用大模型来监督大模型,才能出现超越人类的人工智能。
苍蝇再小也是肉,聚沙成塔。
看看这个时代最伟大 AI 学者的研究脉络。
几乎每一天,AI都在获得新的能力。在机器人、大模型等热门赛道涌现后,专注企业服务的AI技术成为后起之秀,在智能客服、营销获客、企业培训等企服领域大展拳脚。
人工智能(AI)在过去十年里取得了长足进步,特别是在自然语言处理和计算机视觉领域。然而,如何提升 AI 的认知能力和推理能力,仍然是一个巨大的挑战。
看看这个时代最伟大 AI 学者的研究脉络。