AI资讯新闻榜单内容搜索-CVPR

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: CVPR
英伟达提出首个Mamba-Transformer视觉骨干网络!打破精度/吞吐瓶颈 | CVPR 2025

英伟达提出首个Mamba-Transformer视觉骨干网络!打破精度/吞吐瓶颈 | CVPR 2025

英伟达提出首个Mamba-Transformer视觉骨干网络!打破精度/吞吐瓶颈 | CVPR 2025

CVPR 2025,混合新架构MambaVision来了!Mamba+Transformer混合架构专门为CV应用设计。MambaVision 在Top-1精度和图像吞吐量方面实现了新的SOTA,显著超越了基于Transformer和Mamba的模型。

来自主题: AI技术研报
7543 点击    2025-03-08 13:10
CVPR 2025|北大开源多模态驱动的定制化漫画生成框架DiffSensei,还有4.3万页漫画数据集

CVPR 2025|北大开源多模态驱动的定制化漫画生成框架DiffSensei,还有4.3万页漫画数据集

CVPR 2025|北大开源多模态驱动的定制化漫画生成框架DiffSensei,还有4.3万页漫画数据集

北京大学、上海人工智能实验室、南洋理工大学联合推出 DiffSensei,首个结合多模态大语言模型(MLLM)与扩散模型的定制化漫画生成框架。该框架通过创新的掩码交叉注意力机制与文本兼容的角色适配器,实现了对多角色外观、表情、动作的精确控制

来自主题: AI技术研报
8092 点击    2025-03-07 14:15
风格迁移重大突破!西湖大学等提出StyleStudio攻克「过拟合」难题 | CVPR 2025

风格迁移重大突破!西湖大学等提出StyleStudio攻克「过拟合」难题 | CVPR 2025

风格迁移重大突破!西湖大学等提出StyleStudio攻克「过拟合」难题 | CVPR 2025

StyleStudio能解决风格迁移中风格过拟合、文本对齐差和图像不稳定的问题,通过跨模态AdaIN技术融合文本和风格特征、用教师模型稳定布局、引入基于风格的无分类器引导,实现精准控制风格元素,提升生成图像的质量和稳定性,无需额外训练,使用门槛更低!

来自主题: AI技术研报
2580 点击    2025-03-07 11:04
三大竞赛引爆CVPR'25协作智能Workshop全方位探讨多智能体具身系统新机遇,总计1万美元奖金等你来拿

三大竞赛引爆CVPR'25协作智能Workshop全方位探讨多智能体具身系统新机遇,总计1万美元奖金等你来拿

三大竞赛引爆CVPR'25协作智能Workshop全方位探讨多智能体具身系统新机遇,总计1万美元奖金等你来拿

IEEE/CVF国际计算机视觉与模式识别会议(CVPR)是人工智能领域最具学术影响力的顶级会议之一,将于今年 6月11日至6月15日在美国田纳西州举行。

来自主题: AI资讯
5899 点击    2025-02-07 19:45
严禁AI评审!CVPR 2025重申大模型审稿0容忍,一首拒稿小诗爆笑全场

严禁AI评审!CVPR 2025重申大模型审稿0容忍,一首拒稿小诗爆笑全场

严禁AI评审!CVPR 2025重申大模型审稿0容忍,一首拒稿小诗爆笑全场

审稿人严重不足,审稿意见急剧下滑,CVPR官方坐不住了,不仅出台了七条新规,还再三强调,禁止审稿人用大模型生成/翻译评审结果。

来自主题: AI技术研报
6023 点击    2024-12-08 14:14
双深科技获富瀚微数千万战略融资 助力AI技术创新

双深科技获富瀚微数千万战略融资 助力AI技术创新

双深科技获富瀚微数千万战略融资 助力AI技术创新

双深科技近日获得来自上市公司富瀚微(300613.SZ)的数千万元人民币战略投资。双深科技成立于2020年,是一家致力于用AI技术颠覆传统图像和视频压缩与处理的AI创业公司。团队研发实力雄厚,核心成员均来自国内外顶尖高校,并数次在国际人工智能顶级会议CVPR夺得图像与视频编解码领域的全球冠军,奠定了公司在技术上的领先地位。

来自主题: AI资讯
4117 点击    2024-12-02 11:23
从计算机视觉向医疗AI,上海交大谢伟迪发布多项成果,登Nature子刊/NeurIPS/CVPR等

从计算机视觉向医疗AI,上海交大谢伟迪发布多项成果,登Nature子刊/NeurIPS/CVPR等

从计算机视觉向医疗AI,上海交大谢伟迪发布多项成果,登Nature子刊/NeurIPS/CVPR等

近年来,AI for Science 发展提速,不仅为科研领域带来创新研究思路,同时也拓宽了 AI 的落地通路,为其提供了更多具有挑战性的应用场景。在这个过程中,越来越多的 AI 领域研究人员开始关注医疗、材料、生物等传统科研领域,探索其中的研究难点与行业挑战。

来自主题: AI技术研报
6645 点击    2024-11-20 14:30
无需参数访问!CMU用大模型自动优化视觉语言提示词 | CVPR’24

无需参数访问!CMU用大模型自动优化视觉语言提示词 | CVPR’24

无需参数访问!CMU用大模型自动优化视觉语言提示词 | CVPR’24

视觉语言模型(如 GPT-4o、DALL-E 3)通常拥有数十亿参数,且模型权重不公开,使得传统的白盒优化方法(如反向传播)难以实施。

来自主题: AI技术研报
2529 点击    2024-11-05 15:28
ECCV 2024 | 探索离散Token视觉生成中的自适应推理策略

ECCV 2024 | 探索离散Token视觉生成中的自适应推理策略

ECCV 2024 | 探索离散Token视觉生成中的自适应推理策略

本论文第一作者倪赞林是清华大学自动化系 2022 级直博生,师从黄高副教授,主要研究方向为高效深度学习与图像生成。他曾在 ICCV、CVPR、ECCV、ICLR 等国际会议上发表多篇学术论文。

来自主题: AI技术研报
6090 点击    2024-09-19 11:14