AI资讯新闻榜单内容搜索-CV

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: CV
此时此刻,两个Claude智能体正在无休止对话,无人干预

此时此刻,两个Claude智能体正在无休止对话,无人干预

此时此刻,两个Claude智能体正在无休止对话,无人干预

现在,AI 大模型已经疯狂到这种地步了吗?此时此刻,正有两个 Claude 模型在无休止地对话,它们在探索整个宇宙的奥妙。

来自主题: AI资讯
7124 点击    2024-03-31 14:59
CVPR 2024 | 让视频姿态Transformer变得飞速,北大提出高效三维人体姿态估计框架HoT

CVPR 2024 | 让视频姿态Transformer变得飞速,北大提出高效三维人体姿态估计框架HoT

CVPR 2024 | 让视频姿态Transformer变得飞速,北大提出高效三维人体姿态估计框架HoT

目前,Video Pose Transformer(VPT)在基于视频的三维人体姿态估计领域取得了最领先的性能。近年来,这些 VPT 的计算量变得越来越大,这些巨大的计算量同时也限制了这个领域的进一步发展,对那些计算资源不足的研究者十分不友好。例如,训练一个 243 帧的 VPT 模型通常需要花费好几天的时间,严重拖慢了研究的进度,并成为了该领域亟待解决的一大痛点。

来自主题: AI技术研报
7304 点击    2024-03-31 14:44
CVPR 2024|生成不了光线极强的图片?微信视觉团队有效解决扩散模型奇点问题

CVPR 2024|生成不了光线极强的图片?微信视觉团队有效解决扩散模型奇点问题

CVPR 2024|生成不了光线极强的图片?微信视觉团队有效解决扩散模型奇点问题

扩散模型凭借其在图像生成方面的出色表现,开启了生成式模型的新纪元。诸如 Stable Diffusion,DALLE,Imagen,SORA 等大模型如雨后春笋般涌现,进一步丰富了生成式 AI 的应用前景。然而,当前的扩散模型在理论上并非完美,鲜有研究关注到采样时间端点处未定义的奇点问题。此外,奇点问题在应用中导致的平均灰度等影响生成图像质量的问题也一直未得到解决。

来自主题: AI技术研报
5203 点击    2024-03-28 15:31
通用文档理解新SOTA,多模态大模型TextMonkey来了

通用文档理解新SOTA,多模态大模型TextMonkey来了

通用文档理解新SOTA,多模态大模型TextMonkey来了

最近,华中科技大学和金山的研究人员在多模态大模型 Monkey [1](Li et al., CVPR2024)工作的基础上提出 TextMonkey。在多个场景文本和文档的测试基准中,TextMonkey 处于国际领先地位,有潜力带来办公自动化、智慧教育、智慧金融等行业应用领域的技术变革。

来自主题: AI资讯
3055 点击    2024-03-25 16:55
CVPR 2024 | 零样本6D物体姿态估计框架SAM-6D,向具身智能更进一步

CVPR 2024 | 零样本6D物体姿态估计框架SAM-6D,向具身智能更进一步

CVPR 2024 | 零样本6D物体姿态估计框架SAM-6D,向具身智能更进一步

物体姿态估计在许多现实世界应用中起到至关重要的作用,例如具身智能、机器人灵巧操作和增强现实等。

来自主题: AI资讯
2060 点击    2024-03-24 21:49
CVPR 2024 | 一统所有目标感知任务,华科&字节提出目标感知基础模型GLEE

CVPR 2024 | 一统所有目标感知任务,华科&字节提出目标感知基础模型GLEE

CVPR 2024 | 一统所有目标感知任务,华科&字节提出目标感知基础模型GLEE

近年来,LLM 已经一统所有文本任务,展现了基础模型的强大潜力。一些视觉基础模型如 CLIP 在多模态理解任务上同样展现出了强大的泛化能力,其统一的视觉语言空间带动了一系列多模态理解、生成、开放词表等任务的发展。然而针对更细粒度的目标级别的感知任务,目前依然缺乏一个强大的基础模型。

来自主题: AI技术研报
9150 点击    2024-03-21 18:35
CMU朱俊彦、Adobe新作:512x512图像推理,A100只用0.11秒

CMU朱俊彦、Adobe新作:512x512图像推理,A100只用0.11秒

CMU朱俊彦、Adobe新作:512x512图像推理,A100只用0.11秒

简笔素描一键变身多风格画作,还能添加额外的描述,这在 CMU、Adobe 联合推出的一项研究中实现了。作者之一为 CMU 助理教授朱俊彦,其团队在 ICCV 2021 会议上发表过一项类似的研究:仅仅使用一个或数个手绘草图,即可以自定义一个现成的 GAN 模型,进而输出与草图匹配的图像。

来自主题: AI资讯
5756 点击    2024-03-21 18:32
华人CV宗师黄煦涛高徒离职特斯拉,加入OpenAI!专攻多模态模型研究

华人CV宗师黄煦涛高徒离职特斯拉,加入OpenAI!专攻多模态模型研究

华人CV宗师黄煦涛高徒离职特斯拉,加入OpenAI!专攻多模态模型研究

华人科学家程博文官宣即将入职OpenAI,加入后训练团队参与多模态模型研究。值得一提的是,他还是著名华人计算机泰斗Thomas Huang的学生。

来自主题: AI技术研报
4468 点击    2024-03-11 17:44
「AI透视眼」,三次马尔奖获得者Andrew带队解决任意物体遮挡补全难题

「AI透视眼」,三次马尔奖获得者Andrew带队解决任意物体遮挡补全难题

「AI透视眼」,三次马尔奖获得者Andrew带队解决任意物体遮挡补全难题

牛津大学 VGG 实验室 Andrew Zisserman 团队最新工作系统性解决了任意物体的遮挡补全问题,并且为这一问题提出了一个新的更加精确的评估数据集。该工作受到了 MPI 大佬 Michael Black、CVPR 官方账号、南加州大学计算机系官方账号等在 X 平台的点赞。

来自主题: AI技术研报
7021 点击    2024-03-08 15:04