AI资讯新闻榜单内容搜索-DAN

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
搜索: DAN
CVPR 2025 | 2D 大模型赋能3D Affordance 预测,GEAL助力可泛化的3D场景可交互区域识别

CVPR 2025 | 2D 大模型赋能3D Affordance 预测,GEAL助力可泛化的3D场景可交互区域识别

CVPR 2025 | 2D 大模型赋能3D Affordance 预测,GEAL助力可泛化的3D场景可交互区域识别

在现实世界中,如何让智能体理解并挖掘 3D 场景中可交互的部位(Affordance)对于机器人操作与人机交互至关重要。所谓 3D Affordance Learning,就是希望模型能够根据视觉和语言线索,自动推理出物体可供哪些操作、以及可交互区域的空间位置,从而为机器人或人工智能系统提供对物体潜在操作方式的理解。

来自主题: AI技术研报
4624 点击    2025-04-11 09:55
机器人视觉控制新范式!ByteDance Research新算法实现通过性能SOTA

机器人视觉控制新范式!ByteDance Research新算法实现通过性能SOTA

机器人视觉控制新范式!ByteDance Research新算法实现通过性能SOTA

世界模型(World Model)作为近年来机器学习和强化学习的研究热点,通过建立智能体对其所处环境的一种内部表征和模拟,能够加强智能体对于世界的理解,进而更好地进行规划和决策。

来自主题: AI技术研报
6538 点击    2025-02-21 14:28
GR-2登场!ByteDance Research提出机器人大模型,具备世界建模和强大泛化能力

GR-2登场!ByteDance Research提出机器人大模型,具备世界建模和强大泛化能力

GR-2登场!ByteDance Research提出机器人大模型,具备世界建模和强大泛化能力

最近,ByteDance Research 的第二代机器人大模型 —— GR-2,终于放出了官宣视频和技术报告。GR-2 以其卓越的泛化能力和多任务通用性,预示着机器人大模型技术将爆发出巨大潜力和无限可能。

来自主题: AI资讯
5922 点击    2024-10-10 12:04
终于拿到内测!豆包-PixelDance真是字节视频生成大杀器

终于拿到内测!豆包-PixelDance真是字节视频生成大杀器

终于拿到内测!豆包-PixelDance真是字节视频生成大杀器

「火山爆发,震撼天地。」这八个字会在你的头脑中触发怎样的影像?是否与下面的视频类似?

来自主题: AI资讯
7475 点击    2024-09-29 22:34
我用豆包,生成了AI版《红楼梦》MV

我用豆包,生成了AI版《红楼梦》MV

我用豆包,生成了AI版《红楼梦》MV

要论最近最火的AI视频生成模型,无疑就属字节豆包了。

来自主题: AI资讯
6063 点击    2024-09-29 13:59
字节跳动不能输掉的一场仗

字节跳动不能输掉的一场仗

字节跳动不能输掉的一场仗

在模型层,大厂们已经武装到牙齿,各个细分赛道都有相应的模型——留给创业者的空间,要再打个问号。

来自主题: AI资讯
7478 点击    2024-09-26 18:19