AI资讯新闻榜单内容搜索-Udio

一个模型，搞定所有音频生成任务！多项基准SOTA | ICLR'26

港科大团队提出音频生成统一模型AudioX，只需一个模型，就能从文本、视频、图像等任意模态生成高质量音效和音乐，在多项基准上超越专家模型。团队同时开源了700万样本的细粒度标注数据集IF-caps与可控T2A评测基准T2A-bench，并在该基准上大幅领先现有方法。论文已被ICLR 2026接收。

来自主题: AI技术研报

7801 点击 2026-03-09 14:29

小红书，再造一个更有「声」命力的社区

2026 马年注定迎来一个「AI 味」最浓的春节。

来自主题: AI技术研报

10010 点击 2026-02-12 15:34

刚刚，创智+模思发布开源版Sora2，电影级音视频同步生成，打破闭源技术垄断

今天上午，上海创智学院 OpenMOSS 团队联合初创公司模思智能（MOSI），正式发布了端到端音视频生成模型 —— MOVA（MOSS-Video-and-Audio）。

来自主题: AI技术研报

8959 点击 2026-01-30 10:39

真香！刚骂完AI，Linux之父的首个Vibe Coding项目上线

时代变了，就连 Linus Torvalds 现在也氛围编程（Vibe Coding）了。

来自主题: AI资讯

10650 点击 2026-01-13 09:11

真实音频场景，大模型集体挂科！首个原生语音基准MultiChallenge

文本领域的大模型满分选手，换成语音就集体挂科？大模型引以为傲的多轮对话逻辑，在真实人声面前竟然如此脆弱。Scale AI正式发布首个原生音频多轮对话基准Audio MultiChallenge，直接撕开了大模型靠合成语音评测维持的优等生假象。实验显示，强如Gemini 3 Pro在真实场景下的通过率也仅过半数，而GPT-4o Audio的表现更是令人大跌眼镜。

来自主题: AI技术研报

10256 点击 2026-01-06 16:46

8亿部Gemini设备在路上！三星AI“全家桶”来了：冰箱AI管吃喝，电视AI教你做饭

今日，三星在CES 2026“First Look”活动上发布了AI家居“全家桶”，三星将其比喻为“AI生活伴侣”，分为娱乐伴侣、家庭伴侣、健康伴侣三部分。娱乐伴侣方面，三星发布了130英寸Micro RGB电视、电视AI技术Vision AI Companion（VAC）、wifi音响Music Studio 5和Music Studio 7

来自主题: AI资讯

11073 点击 2026-01-05 16:48