CVPR 25 |全面提升视觉感知鲁棒性,生成模型快速赋能三维检测
CVPR 25 |全面提升视觉感知鲁棒性,生成模型快速赋能三维检测来自香港中文大学(深圳)等单位的学者们提出了一种名为 DriveGEN 的无训练自动驾驶图像可控生成方法。该方法无需额外训练生成模型,即可实现训练图像数据的可控扩充,从而以较低的计算资源成本提升三维检测模型的鲁棒性。
来自香港中文大学(深圳)等单位的学者们提出了一种名为 DriveGEN 的无训练自动驾驶图像可控生成方法。该方法无需额外训练生成模型,即可实现训练图像数据的可控扩充,从而以较低的计算资源成本提升三维检测模型的鲁棒性。
在机器人操作中,物体运动往往涉及摩擦、碰撞等复杂物理机制。准确的物理属性描述可以实现对物体运动结果更准确的预测,并提升机器人在操作技能学习中的表现。
AI圈子好热闹。今天凌晨,Claude终于迎来了它的重大版本升级—— Claude 4来了!
在谷歌I/O大会后,创始人谢尔盖·布林惊喜现身,与Hassabis深入探讨AI的推理能力、规模与算法、测试时计算及多模态智能体的应用前景。布林强调AI时代是计算科学家不应退休的黄金期,AI影响将远超互联网与手机。
在今年 2 月的 DeepSeek 开源周中,大模型推理过程中并行策略和通信效率的深度优化成为重点之一。在今年 2 月的 DeepSeek 开源周中,大模型推理过程中并行策略和通信效率的深度优化成为重点之一。
Mistral沉默好久,果然在憋大招。
大家好,我是「沉浸式学AI」,专注于分享AI前沿技术与实战经验。2025年,要搭建一个真正“聪明又自主”的AI代理,离不开一整套“全家桶”式的开源工具——从大脑(推理、记忆),到肢体(浏览器、桌面操控),再到声音(语音交互),全流程打通。
如果用一句话为 2025 年写下注脚,那它不会是某个技术名词,而更像是一种哲学上的转变:“这一年,我们不再是孤立地使用软件,而是与智能的代理人(Agent)共舞,它们正悄然重塑我们的工作与生活。”
AI编程梦被撕碎!最新研究用57.6万个代码样本揭示:超20%代码依赖的是不存在的软件包。苹果、微软都曾中招,而Meta和微软还在高喊「未来AI写95%代码」。AI写代码的神话,正在变成安全灾难。
全世界最大的电脑展之一——COMPUTEX台北电脑展正式拉开了序幕。 COMPUTEX大会自创办以来已有43年历史,是亚洲最大、全球第二的ICT产业盛会,本届展会以“AI Next”为主题,汇聚全球超2000家科技巨头与创新企业,不仅拥有着琳琅满目的参展品牌和产品,更重要的是,那些全球顶级的上游厂商、存储厂商和PC厂商们都会在这里公布全新一代产品。