中科大、上海AI实验室等组成的ShareGPT4V团队,推出了新的视频数据集,登顶HuggingFace排行榜!
中科大、上海AI实验室等组成的ShareGPT4V团队,推出了新的视频数据集,登顶HuggingFace排行榜!
难度大升级的多任务长视频理解评测基准MLVU来了!
从任意单目视频重建可渲染的动态场景是计算机视觉研究领域的一个圣杯。
继Sora官宣之后,多模态大模型在视频生成方面的应用简直就像井喷一样涌现出来,LUMA、Gen-3 Alpha等视频生成模型展现了极佳质量的艺术风格和视频场景的细节雕刻能力,文生视频、图生视频的新前沿不断被扩展令大家惊喜不已,抱有期待。
测试Gemini1.5 Pro、GPT-4o等多模态大模型的新基准来了,针对视频理解能力的那种。
将音频、图像、视频整合进同一工作流,这个由斯坦福初创公司发布的视频工具火了! 预览版支持生成30S逼真视频,网友们直呼不输Luma。
太震撼了!AI视频老牌选手Runway出手了,深夜发布的Gen-3在保真度、一致性和精细程度上再次重磅升级,画面细节直接到达了电影级画质,再次震惊全体网友。AI视频已经进入了神仙打架阶段。Sora危了?
抢先OpenAI一步的「国产Sora」,再给开源社区带来亿点点震撼:权重代码全开源!16秒720p高清画质一键生成,人物渲染逼真到爆,电影级变焦。而美国独角兽基于之前权重打造的数字宇宙,直接让乐高迷嗨翻了。
16秒720p高清视频,现在人人可免费一键生成!
AI圈这遍地开花的大好局面,让吃瓜群众们甚是惊喜。