IEEE/CVF国际计算机视觉与模式识别会议(CVPR)是人工智能领域最具学术影响力的顶级会议之一,将于今年 6月11日至6月15日在美国田纳西州举行。
在CVPR 2025大会上,来自香港大学、清华大学、上海AI Lab、斯坦福大学等全球知名学术机构的学者将联合举办第二届协作智能Workshop。
这次为期一整天的Workshop以“生成式人工智能时代中的多智能体具身系统”为主题,深入探讨生成式AI技术为多智能体具身系统带来的新机遇、面临的技术挑战以及未来发展方向。
https://coop-intelligence.github.io/
本届Workshop的内容设置全面而深入,主题涵盖低空飞行、自动驾驶、机器人、AI智能体等多个前沿领域。活动形式丰富多样,除传统的论文征稿和学术研讨外,还特别设置了三大特色竞赛单元:
1. 协同与端到端自动驾驶挑战赛
这个挑战旨在利用自车和基础设施的传感器数据,解决端到端自动驾驶与V2X协同的问题,通过融合不同视角的传感器数据来生成可靠的驾驶计划。通过处理传感器融合和通信限制的复杂性,这个挑战有望推动协同自动驾驶技术的进一步发展。
2. 双臂协作机器人竞赛
这项比赛基于RoboTwin平台,以期推动双臂协作机器人的发展。参赛者需要开发能够有效协调两只机器人手臂完成各种操作任务的控制策略。这些任务会使用真实的遥控数据和通过数字孪生生成的合成数据,涵盖不同的场景。最终目标是开发出能够处理复杂物体操作的灵巧协作机器人,比如使用工具、交接物体,以及减少两只手臂之间的干扰。RoboTwin基准测试希望激发双臂机器人领域的创新,鼓励参赛者开发适应性强、精确且高效的解决方案。
3. 人机交互挑战赛
这项挑战赛聚焦投掷和接住各种随机物体的技能,主要包括两个任务:
第一个任务为规划投掷方投掷物体时所需到达的位置和速度,以及达到投掷准备姿势之前所需的运动。输入条件包括物体本身、接者的位置,以及接者希望在三维空间中接住物体的目标位置等。
第二个任务则专注于规划接住物体时手的位置和姿势,以及在接住瞬间之前的运动。输入条件包括投掷者的动作和接者观察物体飞行的第一人称视角画面。
每项赛事均设有三个奖项等级,分别为一等奖、二等奖和三等奖,将授予表现最为出色的前三支队伍。获奖队伍将分别获得1500美元、1000美元和500美元的奖金,以表彰他们的卓越表现和创新成果。
第一届协同具身智能Workshop@ECCV2024 活动现场
本届Workshop诚邀与以下主题相关(但不限于)的投稿,将评选出最佳论文奖(Best Workshop Paper),获奖者将获得荣誉证书及500美元奖金:
2.Multi-agent Robotic System and Swarm Robots
3.Swarm of Drones and Aerial Robots
4.Communication-Efficient Cooperative Perception
5.Cooperative Motion Prediction and Decision-Making
6.End-to-End Cooperative Policy Learning
7.Efficient and Intelligent V2X Communication
8.Data Security and Privacy in Multi-agent Communication
9.Multi-Robot Exploration and Mapping
10.Intelligent Transportation Systems
11.Large Language Model-assisted Cooperative Systems
12.AI Agents in Cooperative Systems
13.Foundation Models for Cooperative Systems
14.Generative Models for Data Synthesis and Simulation
15.Datasets and Benchmarks for Cooperative Learning
16.Safety and Security of Multi-Agent Systems
Paper Submission Open: Februray 01, 2025
Submission Abstract Deadline: March 10, 2025
Paper Submission Deadline: March 20, 2025
Notification of Acceptance: March 31, 2025
Camera Ready: April 07, 2025
论文提交入口:https://openreview.net/group?id=thecvf.com/CVPR/2025/Workshop/MEIS
第二届CVPR多智能体具身系统研讨会
https://coop-intelligence.github.io/
文章来自于微信公众号“量子位”,作者“MEIS Workshop团队”
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md