
多模态大模型持续学习系列研究,综述+Benchmark+方法+Codebase一网打尽!
多模态大模型持续学习系列研究,综述+Benchmark+方法+Codebase一网打尽!近年来,生成式 AI 和多模态大模型在各领域取得了令人瞩目的进展。然而,在现实世界应用中,动态环境下的数据分布和任务需求不断变化,大模型如何在此背景下实现持续学习成为了重要挑战
近年来,生成式 AI 和多模态大模型在各领域取得了令人瞩目的进展。然而,在现实世界应用中,动态环境下的数据分布和任务需求不断变化,大模型如何在此背景下实现持续学习成为了重要挑战
来自斯坦福的研究者们最近发布的一篇论文(https://arxiv.org/abs/2509.01684)直指RL强化学习在机器学习工程(Machine Learning Engineering)领域的两个关键问题,并克服了它们,最终仅通过Qwen2.5-3B便在MLE任务上超越了仅依赖提示(prompting)的、规模更大的静态语言模型Claude3.5。
苹果研究人员发现,在大模型中,极少量的参数,即便只有0.01%,仍可能包含数十万权重,他们将这一发现称为「超级权重」。超级权重点透了大模型「命门」,使大模型走出「炼丹玄学」。
AI自己玩手机、玩电脑、操作网页浏览器……背后还只靠一个模型。 卷王字节Seed又把智能体带到了一个全新level~
9 月 4 日消息,Atlassian 宣布已同意以 6.1 亿美元现金收购初创企业 The Browser Company。后者是最近知名的 AI 浏览器 Dia,以及 Arc 浏览器的母公司。
存款60美元、欠债1.5万美元,82岁的Luis正在积极学习提示词策略,创办科技公司,他想用AI为自己的人生来一场漂亮的收官;年近80的Scalettar,教会了96岁丈夫使用AI编辑。AI为许多美国老年人打开了一个新世界,他们比许多年轻人更接受,也更会用AI。
8月,nano‑banana登顶LMArena文生图像榜单,带动LMArena社区流量暴增10倍,月活用户300万+。nano‑banana在LMArena启动盲测后,短短两周便吸引了超过500万次总投票,并单独赢得了250万+直接投票,创下历史最高参与度。
近日,快手与清华大学孙立峰团队联合发表论文《Towards User-level QoE: Large-scale Practice in Personalized Optimization of Adaptive Video Streaming》,被计算机网络领域的国际顶尖学术会议 ACM SIGCOMM 2025 录用。
最近,自学 Django 三个月的开发者 kekda_charger在技术社区Reddit抛出了一个引发热议的困惑——靠着 AI 辅助,他已经能做出带用户认证的 Web 应用、实时更新功能的系统,甚至完成 API 集成;但一旦脱离 AI,连简单的登录模块都要折腾两三天。
9月2日,AI生物医药公司CHARM Therapeutics宣布完成超额认购的 B 轮融资,共计筹集8000万美元。(约合人民币5.7亿元)