
AI集体“听不懂”!MMAR基准测试揭示音频大模型巨大短板
AI集体“听不懂”!MMAR基准测试揭示音频大模型巨大短板用AI来整理会议内容,已经是人类的常规操作。 不过,你猜怎么着?面对1000道多步骤音频推理题时,30款AI模型竟然几乎全军覆没,很多开源模型表现甚至接近瞎猜。
用AI来整理会议内容,已经是人类的常规操作。 不过,你猜怎么着?面对1000道多步骤音频推理题时,30款AI模型竟然几乎全军覆没,很多开源模型表现甚至接近瞎猜。
AI会有情感吗?机器人会不会感知到疼痛?未来人类与AI的边界在哪里?我们梳理了"互联网女皇"玛丽·米克尔、"AI教父"杰弗里·辛顿、科技预言家凯文·凯利、DeepMind CEO德米斯·哈萨比斯的近期访谈,他们从诸多维度,各自表达他们心中的AI时代图景。
当前,强化学习(RL)在提升大语言模型(LLM)推理能力方面展现出巨大潜力。DeepSeek R1、Kimi K1.5 和 Qwen 3 等模型充分证明了 RL 在增强 LLM 复杂推理能力方面的有效性。
这两天,很多媒体都在写用AI考高考题的内容。
苹果最新大模型论文,在AI圈炸开了锅。 有人总结到:苹果刚刚当了一回马库斯,否定了所有大模型的推理能力。
还在让大模型写高考作文?有本事做高考数学卷子。 又是一年高考时。 这届考生上午刚经历了抽象作文的洗礼,下午又被数学无情创飞。
该项目来自百家 AI,是北京邮电大学白婷副教授所指导的研究小组, 团队致力于为硅基人类倾力打造情感饱满、记忆超凡的智慧大脑。
本期内容是拾象 CEO 李广密对大模型公司阶跃星辰首席科学家张祥雨的访谈。
一年一度,腾讯又开始招募顶尖学生了——“星火挑战营”,计划招募60-70人,主要面向高二、高三学生(2025级高考生)。一旦入选,就有机会前往深圳总部,挑战一线产业难题。
迄今为止行业最大的开源力度。在大模型上向来低调的小红书,昨天开源了首个自研大模型。