AI资讯新闻榜单内容搜索-Vide

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
搜索: Vide
此时此刻,两个Claude智能体正在无休止对话,无人干预

此时此刻,两个Claude智能体正在无休止对话,无人干预

此时此刻,两个Claude智能体正在无休止对话,无人干预

现在,AI 大模型已经疯狂到这种地步了吗?此时此刻,正有两个 Claude 模型在无休止地对话,它们在探索整个宇宙的奥妙。

来自主题: AI资讯
7033 点击    2024-03-31 14:59
CVPR 2024 | 让视频姿态Transformer变得飞速,北大提出高效三维人体姿态估计框架HoT

CVPR 2024 | 让视频姿态Transformer变得飞速,北大提出高效三维人体姿态估计框架HoT

CVPR 2024 | 让视频姿态Transformer变得飞速,北大提出高效三维人体姿态估计框架HoT

目前,Video Pose Transformer(VPT)在基于视频的三维人体姿态估计领域取得了最领先的性能。近年来,这些 VPT 的计算量变得越来越大,这些巨大的计算量同时也限制了这个领域的进一步发展,对那些计算资源不足的研究者十分不友好。例如,训练一个 243 帧的 VPT 模型通常需要花费好几天的时间,严重拖慢了研究的进度,并成为了该领域亟待解决的一大痛点。

来自主题: AI技术研报
7212 点击    2024-03-31 14:44
Stable Video 3D震撼上线,视频扩散模型史诗级提升!4090可跑,权重已开放

Stable Video 3D震撼上线,视频扩散模型史诗级提升!4090可跑,权重已开放

Stable Video 3D震撼上线,视频扩散模型史诗级提升!4090可跑,权重已开放

近日,Stability AI又发布了新作SV3D,基于视频扩散模型的SV3D将3D模型生成的效果提升了一大截,模型权重已在huggingface开放。

来自主题: AI技术研报
3306 点击    2024-03-21 10:20
Stable Video 3D震撼登场:单图生成无死角3D视频、模型权重开放

Stable Video 3D震撼登场:单图生成无死角3D视频、模型权重开放

Stable Video 3D震撼登场:单图生成无死角3D视频、模型权重开放

3D 生成领域迎来新的「SOTA 级选手」,支持商用和非商用。Stability AI 的大模型家族来了一位新成员。昨日,Stability AI 继推出文生图 Stable Diffusion、文生视频 Stable Video Diffusion 之后,又为社区带来了 3D 视频生成大模型「Stable Video 3D」(简称 SV3D)。

来自主题: AI技术研报
6080 点击    2024-03-20 16:10
Stability AI开源上新:3D生成引入视频扩散模型,质量一致性up,4090可玩

Stability AI开源上新:3D生成引入视频扩散模型,质量一致性up,4090可玩

Stability AI开源上新:3D生成引入视频扩散模型,质量一致性up,4090可玩

Stable Diffusion背后公司Stability AI又上新了。 这次带来的是图生3D方面的新进展: 基于Stable Video Diffusion的Stable Video 3D(SV3D),只用一张图片就能生成高质量3D网格。

来自主题: AI资讯
3243 点击    2024-03-19 21:35
首批类Sora模型出现,色拉布上线Snap Video,效果优于Pika、不输Gen-2

首批类Sora模型出现,色拉布上线Snap Video,效果优于Pika、不输Gen-2

首批类Sora模型出现,色拉布上线Snap Video,效果优于Pika、不输Gen-2

最近,OpenAI 视频生成模型 Sora 的爆火,给基于 Transformer 的扩散模型重新带来了一波热度,比如 Sora 研发负责人之一 William Peebles 与纽约大学助理教授谢赛宁去年提出的 DiT(Diffusion Transformer)。

来自主题: AI技术研报
2830 点击    2024-03-01 13:43
谷歌AI视频再出王炸!全能通用视觉编码器VideoPrism,性能刷新30项SOTA

谷歌AI视频再出王炸!全能通用视觉编码器VideoPrism,性能刷新30项SOTA

谷歌AI视频再出王炸!全能通用视觉编码器VideoPrism,性能刷新30项SOTA

谷歌团队推出「通用视觉编码器」VideoPrism,在3600万高质量视频字幕对和5.82亿个视频剪辑的数据集上完成了训练,性能刷新30项SOTA。

来自主题: AI技术研报
3121 点击    2024-02-25 15:39
国内高校打造类Sora模型VDT,通用视频扩散Transformer被ICLR 2024接收

国内高校打造类Sora模型VDT,通用视频扩散Transformer被ICLR 2024接收

国内高校打造类Sora模型VDT,通用视频扩散Transformer被ICLR 2024接收

2 月 16 日,OpenAI Sora 的发布无疑标志着视频生成领域的一次重大突破。Sora 基于 Diffusion Transformer 架构,和市面上大部分主流方法(由 2D Stable Diffusion 扩展)并不相同。

来自主题: AI技术研报
5037 点击    2024-02-24 14:54
效果超越Gen-2!字节最新视频生成模型,一句话让绿巨人戴上VR眼镜

效果超越Gen-2!字节最新视频生成模型,一句话让绿巨人戴上VR眼镜

效果超越Gen-2!字节最新视频生成模型,一句话让绿巨人戴上VR眼镜

是字节最新的AI视频生成模型MagicVideo-V2,各种奇思妙想的想法都能实现。它不仅支持4K、8K超高分辨率,轻松hold各种绘图风格。

来自主题: AI资讯
5191 点击    2024-01-11 15:04