
真实场景也能批量造「险」!VLM+扩散模型打造真实域自动驾驶极限测试
真实场景也能批量造「险」!VLM+扩散模型打造真实域自动驾驶极限测试浙江大学与哈工大(深圳)联合推出SafeMVDrive,利用扩散模型结合VLM实现批量化多视角真实域的安全关键视频生成。该方法在保持画质与真实感的同时,显著增强了驾驶场景的危险性。生成的场景用于端到端自动驾驶系统的极限压测,可使得模型的碰撞率提升50倍。
浙江大学与哈工大(深圳)联合推出SafeMVDrive,利用扩散模型结合VLM实现批量化多视角真实域的安全关键视频生成。该方法在保持画质与真实感的同时,显著增强了驾驶场景的危险性。生成的场景用于端到端自动驾驶系统的极限压测,可使得模型的碰撞率提升50倍。
近年来,以GPT-4o、Gemini 2.5 Pro为代表的多模态大模型,在各大基准测试(如MMMU)中捷报频传,纷纷刷榜成功。
AI的平均智商已突破110,正式超越普通人类。2025,AI开始参与经济系统的「全链条操作」。从信息收集、判断决策到实际执行,完整经济链条第一次有非人类主体独立运行,AI改写商业底层规则!凯恩斯百年预言终将来临,AI经济正在浮现。
刚刚,大神Karpathy发布全新Vibe Coding指南!
Github CEO卸任后未被替代,宣布并入微软Core AI部门,终结其七年独立运营。开发者担忧此举损害开源独立性及免费数据访问,质疑Copilot等AI战略会主导未来。微软此举旨在整合资源强化AI开发工具,但社区文化前景存疑。
一早起来,看到群里炸了锅!主角是我们备受期待的 DeepSeek V3.1 模型。有用户反馈,该模型在生成文本时,会毫无征兆地随机插入“极”这个汉字(繁体简体都会)
“相当于在豆包里面装了一个抖音。”一位家长这样抱怨。她发现,尽管家里严格管控孩子使用短视频App,却没想到,一款AI应用成了孩子刷视频的“后门”。
据申妈朋友圈报道,字节Seed大模型视觉基础研究团队负责人冯佳时已正式离职。根据其在字节的职级体系判断,他的级别应在4-1或4-2之间,属于公司最为稀缺的核心研究序列。冯佳时后续去向或是AI创业。
为何画一条小丑鱼能给人《王者荣耀》上分的快感? 见过赛博遛狗,你见过赛博养鱼吗?
AI视频生成,快速进入Agent时代! 只需一句提示词:生成一个F1赛车的现场解说视频。 AI即可自动完成分镜、画面、配音、字幕,生成结构完整、节奏在线的爆款视频。