
AI音效90秒长时可控生成!“狼嚎2秒,蟋蟀鸣8秒”精准搞定!清华&生数科技新研究入选ACM MM 2025
AI音效90秒长时可控生成!“狼嚎2秒,蟋蟀鸣8秒”精准搞定!清华&生数科技新研究入选ACM MM 2025文生音频系统最新突破,实现精确时间控制与90秒长时音频生成!
文生音频系统最新突破,实现精确时间控制与90秒长时音频生成!
现有视频异常检测(Video Anomaly Detection, VAD)方法中,有监督方法依赖大量领域内训练数据,对未见过的异常场景泛化能力薄弱;而无需训练的方法虽借助大语言模型(LLMs)的世界知识实现检测,但存在细粒度视觉时序定位不足、事件理解不连贯、模型参数冗余等问题。
本文第一作者为前阿里巴巴达摩院高级技术专家,现一年级博士研究生满远斌,研究方向为高效多模态大模型推理和生成系统。通信作者为第一作者的导师,UTA 计算机系助理教授尹淼。尹淼博士目前带领 7 人的研究团队,主要研究方向为多模态空间智能系统,致力于通过软件和系统的联合优化设计实现空间人工智能的落地。
用AI来整理会议内容,已经是人类的常规操作。 不过,你猜怎么着?面对1000道多步骤音频推理题时,30款AI模型竟然几乎全军覆没,很多开源模型表现甚至接近瞎猜。
近日,新一届 ACM 博士论文奖正式公布。
2002年,在拿下中国高校第一个ACM(计算机领域最顶尖的程序设计大赛)金牌后,上海交大设立了“ACM班”,这个用最高竞赛命名的班级后来人尽皆知,成为中国AI人才的重要阵地。也在那年,李磊成为ACM班第一届的学生。在ACM班他第一次意识到,“原来计算机能帮助解决人类的这么多问题。”
美国就业市场被颠覆:程序员需求45年最低,而文科生被内外夹击。但最近ACM的博客文章,提出了耳目一新的观点:GenAI是文科和计算机科学复兴的唯一希望。顺GenAI则昌,逆之则亡!
今天凌晨,国际计算机学会(ACM)宣布了今年的 ACM 计算突破奖获奖者。丛京生(Jason Cong)「因其在现场可编程系统和可定制计算的设计和自动化方面做出的奠基性贡献而获奖」。
就在刚刚,2024 ACM计算奖出炉!苏黎世联邦理工学院Torsten Hoefler教授获奖,理由是对高性能计算HPC及持续推进的AI革命的贡献。在20多岁时,他就完成了许多重要工作,这证明年龄绝非在CS取得突破的障碍!
强化学习先驱 Andrew Barto 与 Richard Sutton 获得今年的 ACM 图灵奖。