AI资讯新闻榜单内容搜索-3D

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 3D
用扩散模型监督NeRF,清华文生3D新方法成新SOTA

用扩散模型监督NeRF,清华文生3D新方法成新SOTA

用扩散模型监督NeRF,清华文生3D新方法成新SOTA

近日,清华大学刘永进教授课题组提出了一种基于扩散模型的文生3D新方式。无论是不同视角间的一致性,还是与提示词的匹配度,都比此前大幅提升。

来自主题: AI资讯
9644 点击    2023-12-29 17:22
英伟达官方盘点2023年10大研究!「神经朗琪罗」秒变逼真大卫,用AI生成3D虚拟世界

英伟达官方盘点2023年10大研究!「神经朗琪罗」秒变逼真大卫,用AI生成3D虚拟世界

英伟达官方盘点2023年10大研究!「神经朗琪罗」秒变逼真大卫,用AI生成3D虚拟世界

英伟达官方盘点2023年10大研究,从CV到AI,从智能体到生成式AI。英伟达不但现实世界中用GPU收割全世界,也在虚拟世界中用一项项匪夷所思的技术展开了一场革命。

来自主题: AI资讯
5961 点击    2023-12-24 15:44
医学通用分割模型来了!一口气分割200多个解剖类别,发布即开源 | 智源出品

医学通用分割模型来了!一口气分割200多个解剖类别,发布即开源 | 智源出品

医学通用分割模型来了!一口气分割200多个解剖类别,发布即开源 | 智源出品

医学领域的通用分割模型来啦,发布即开源!来自智源,模型名为SegVol,划重点:是第一次实现同时支持框(box)、点(point)和文本(text) prompt进行任意尺寸原分辨率的3D体素分割。

来自主题: AI资讯
1997 点击    2023-12-23 16:25
走在GPT 4.5前面?3D、视频直接扔进对话框,大模型掌握跨模态推理

走在GPT 4.5前面?3D、视频直接扔进对话框,大模型掌握跨模态推理

走在GPT 4.5前面?3D、视频直接扔进对话框,大模型掌握跨模态推理

最近,有人在社交媒体上发布了一张有关 GPT4.5 更新的截图。图中内容显示,和 GPT 系列之前推出的模型相比,GPT4.5 最大的惊喜可能就是处理 3D 和视频的能力。至于 3D 能力到底是指看得懂 3D 图像,还是能输入 3D 模型,目前只能靠猜。

来自主题: AI技术研报
4592 点击    2023-12-17 19:41
GPT-4.5大泄露,支持视频3D、价格狂涨6倍?奥特曼亲自回应

GPT-4.5大泄露,支持视频3D、价格狂涨6倍?奥特曼亲自回应

GPT-4.5大泄露,支持视频3D、价格狂涨6倍?奥特曼亲自回应

GPT 4.5疑似大泄漏: 一个是新模型将具备全新多模态能力,文本语音图片以及视频和3D信息全都能一并处理,并且还可以跨模态理解。

来自主题: AI技术研报
7555 点击    2023-12-15 18:57
2023年度十大前沿科技趋势发布:6大赛道10项技术,智能体和3D生成正引爆AI,空间计算开启终端变革、端到端自动驾驶成共识

2023年度十大前沿科技趋势发布:6大赛道10项技术,智能体和3D生成正引爆AI,空间计算开启终端变革、端到端自动驾驶成共识

2023年度十大前沿科技趋势发布:6大赛道10项技术,智能体和3D生成正引爆AI,空间计算开启终端变革、端到端自动驾驶成共识

区别于其他智库和研究机构,量子位智库基于量子位长期以来对AI及其他前沿科技的追踪报道,积累了数年对前沿科技的深入洞察。

来自主题: AI资讯
4978 点击    2023-12-15 18:41
随意指定CLIP关注区域!上交复旦等发布Alpha-CLIP:同时保持全图+局部检测能力

随意指定CLIP关注区域!上交复旦等发布Alpha-CLIP:同时保持全图+局部检测能力

随意指定CLIP关注区域!上交复旦等发布Alpha-CLIP:同时保持全图+局部检测能力

本文介绍了一个名为Alph-CLIP的框架,它在原始的接受RGB三通道输入的CLIP模型的上额外增加了一个alpha通道。在千万量级的RGBA-region的图像文本对上进行训练后,Alpha-CLIP可以在保证CLIP原始感知能力的前提下,关注到任意指定区域。通过替换原始CLIP的应用场景,Alpha-CLIP在图像识别、视觉-语言大模型、2D乃至3D生成领域都展现出强大作用。

来自主题: AI资讯
7949 点击    2023-12-13 16:14