
AI集体“听不懂”!MMAR基准测试揭示音频大模型巨大短板
AI集体“听不懂”!MMAR基准测试揭示音频大模型巨大短板用AI来整理会议内容,已经是人类的常规操作。 不过,你猜怎么着?面对1000道多步骤音频推理题时,30款AI模型竟然几乎全军覆没,很多开源模型表现甚至接近瞎猜。
用AI来整理会议内容,已经是人类的常规操作。 不过,你猜怎么着?面对1000道多步骤音频推理题时,30款AI模型竟然几乎全军覆没,很多开源模型表现甚至接近瞎猜。
家人们,又有好玩儿的AI出现了—— 火山引擎发布豆包·播客模型! 来来来,我们直接听一段:
在前端开发的世界里,一款名为Onlook的开源工具正在掀起一场革命。这款被称为"设计师的Cursor"的神器,完美解决了长久以来困扰开发团队的协作难题。
6月6日,麻省理工学院与Recursion共同宣布推出一款突破性的AI+药物研发模型Boltz-2,用于预测药物靶标 3D 结构,以及结合亲和力。
translate.js(https://github.com/xnx3/translate)是面向开发者打造的一个简单而强大的前端国际化工具,专注于提供极简高效的多语言切换能力。项目完全开源并允许商业使用。
当前,强化学习(RL)在提升大语言模型(LLM)推理能力方面展现出巨大潜力。DeepSeek R1、Kimi K1.5 和 Qwen 3 等模型充分证明了 RL 在增强 LLM 复杂推理能力方面的有效性。
2025年,美国就业大地震!与同期相比,全美裁员人数,上涨了47%。「政府效率部」掀起裁员潮之后,科技行业迎来「冰火两重天」。
苹果最新大模型论文,在AI圈炸开了锅。 有人总结到:苹果刚刚当了一回马库斯,否定了所有大模型的推理能力。
即梦AI的图片3.0生图功能更新之后基本是国内图像模型的天花板了,尤其是在日常的设计任务上,基本上人人都能做海报。
还在让大模型写高考作文?有本事做高考数学卷子。 又是一年高考时。 这届考生上午刚经历了抽象作文的洗礼,下午又被数学无情创飞。