AI资讯新闻榜单内容搜索-自动驾驶

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 自动驾驶
一句话手机自己打车,开源多智能体AI助手,非苹果手机也能玩

一句话手机自己打车,开源多智能体AI助手,非苹果手机也能玩

一句话手机自己打车,开源多智能体AI助手,非苹果手机也能玩

一句话让AI自动化操作手机,打个车已经不是难事了。 从官方公布的演示视频来看,用户只需要说出目的地,Agent就能够通过规划、决策和反思的流程自动化帮用户完成目的地输入,呼叫车辆等操作,适用于老人及视障人群,解决他们不会使用或者无法使用手机APP的问题。

来自主题: AI技术研报
8875 点击    2024-06-13 21:27
CVPR 2024 | 合成视频数据集里只有单人数据?M3Act破解人群行为标注难题

CVPR 2024 | 合成视频数据集里只有单人数据?M3Act破解人群行为标注难题

CVPR 2024 | 合成视频数据集里只有单人数据?M3Act破解人群行为标注难题

通过视觉信息识别、理解人群的行为是视频监测、交互机器人、自动驾驶等领域的关键技术之一,但获取大规模的人群行为标注数据成为了相关研究的发展瓶颈。如今,合成数据集正成为一种新兴的,用于替代现实世界数据的方法,但已有研究中的合成数据集主要聚焦于人体姿态与形状的估计。它们往往只提供单个人物的合成动画视频,而这并不适用于人群的视频识别任务。

来自主题: AI技术研报
8571 点击    2024-06-01 19:06
港大字节提出多模态大模型新范式,模拟人类先感知后认知,精确定位图中物体

港大字节提出多模态大模型新范式,模拟人类先感知后认知,精确定位图中物体

港大字节提出多模态大模型新范式,模拟人类先感知后认知,精确定位图中物体

当前,多模态大模型 (MLLM)在多项视觉任务上展现出了强大的认知理解能力。 然而大部分多模态大模型局限于单向的图像理解,难以将理解的内容映射回图像上。 比如,模型能轻易说出图中有哪些物体,但无法将物体在图中准确标识出来。 定位能力的缺失直接限制了多模态大模型在图像编辑,自动驾驶,机器人控制等下游领域的应用。针对这一问题,港大和字节跳动商业化团队的研究人员提出了一种新范式Groma

来自主题: AI资讯
8187 点击    2024-05-27 16:31
马斯克“掀桌子”,AI大模型+自动驾驶会诞生什么?

马斯克“掀桌子”,AI大模型+自动驾驶会诞生什么?

马斯克“掀桌子”,AI大模型+自动驾驶会诞生什么?

本文介绍了特斯拉全自动驾驶FSD V12新版本的颠覆性变化,采用了端到端的AI大模型,取代了以往的Rule-base方案。

来自主题: AI资讯
2871 点击    2024-05-25 10:47
智能驾驶的「GPT 时刻」,怎么就被特斯拉搞出来了?

智能驾驶的「GPT 时刻」,怎么就被特斯拉搞出来了?

智能驾驶的「GPT 时刻」,怎么就被特斯拉搞出来了?

5 月 15 日,针对特斯拉 FSD(Full-Self Driving,全自动驾驶)付费选装率仅 2% 的消息,特斯拉 CEO 马斯克在 X 平台上回复称,实际情况远远超过了这个数字。

来自主题: AI资讯
8396 点击    2024-05-21 09:12
中美AI的五月剧变

中美AI的五月剧变

中美AI的五月剧变

中国和国际AI合作不断深化,特斯拉计划在中国建立数据中心,推进FSD全自动驾驶算法。 美国采取技术封锁措施,对中国等国家实施人工智能模型出口管制。

来自主题: AI资讯
2932 点击    2024-05-20 10:10