AI资讯新闻榜单内容搜索-MSU

大模型真听懂了吗？最全综合性口语感知与推理基准 | ICLR'26

随着多模态大模型能力不断扩展，语音大模型(SpeechLLMs) 已从语音识别走向复杂语音交互。然而，当模型逐渐进入真实口语交互场景，一个更基础的问题浮现出来：我们是否真正定义清楚了「语音理解」的能力边界？

来自主题: AI技术研报

10669 点击 2026-02-24 15:35

Z Potentials｜沈俊潇：从 Meta 出走，剑桥博士创立 Memories.ai，获 Samsung Next、Susa Ventures 千万美元押注

过去几年，AI 行业几乎把所有注意力都投向了“会不会想”：更强的推理、更大的模型、更快的生成。但在真实世界里，很多问题并不是想不想得出来，而是你到底记不记得发生过什么——尤其是视频。

来自主题: AI资讯

9788 点击 2026-02-11 15:21

Cartesia: 3 个月融资 9100 万美元，从 Transformer 到 Mamba 重塑语音 AI

2025 年 3 月 11 日，语音生成初创公司 Cartesia 宣布完成 6400 万美元 A 轮融资，距其 2700 万美元种子轮融资仅过去不到 3 个月。本轮融资由 Kleiner Perkins 领投，Lightspeed、Index、A*、Greycroft、Dell Technologies Capital 和 Samsung Ventures 等跟投。

来自主题: AI资讯

8241 点击 2025-04-06 17:38