ShareGPT4V作者团队又一力作!百万高质量视频-字幕数据助力社区提升多模态大模型视频理解及生成能力
ShareGPT4V作者团队又一力作!百万高质量视频-字幕数据助力社区提升多模态大模型视频理解及生成能力继Sora官宣之后,多模态大模型在视频生成方面的应用简直就像井喷一样涌现出来,LUMA、Gen-3 Alpha等视频生成模型展现了极佳质量的艺术风格和视频场景的细节雕刻能力,文生视频、图生视频的新前沿不断被扩展令大家惊喜不已,抱有期待。
继Sora官宣之后,多模态大模型在视频生成方面的应用简直就像井喷一样涌现出来,LUMA、Gen-3 Alpha等视频生成模型展现了极佳质量的艺术风格和视频场景的细节雕刻能力,文生视频、图生视频的新前沿不断被扩展令大家惊喜不已,抱有期待。
Claude大模型又双叒叕更新升级了!
大模型、AI 搜索的一次重要实践。
今天, OpenAI劲敌Anthropic忽然丢炸弹,发布下一代旗舰大模型Claude 3.5 Sonnet。
将音频、图像、视频整合进同一工作流,这个由斯坦福初创公司发布的视频工具火了! 预览版支持生成30S逼真视频,网友们直呼不输Luma。
太震撼了!AI视频老牌选手Runway出手了,深夜发布的Gen-3在保真度、一致性和精细程度上再次重磅升级,画面细节直接到达了电影级画质,再次震惊全体网友。AI视频已经进入了神仙打架阶段。Sora危了?
曾经的视频生成王者Runway,带着大招鲨~回来了——
SAX-NeRF框架,一种专为稀疏视角下X光三维重建设计的新型NeRF方法,通过Lineformer Transformer和MLG采样策略显著提升了新视角合成和CT重建的性能。研究者还建立了X3D数据集,并开源了代码和预训练模型,为X光三维重建领域的研究提供了宝贵的资源和工具。
就在刚刚,英伟达市值超越微软,成为全球市值最高公司!而CEO老黄的净资产也随之增至1170亿美元,成为全球TOP 11富人。随着全世界疯抢英伟达GPU,华尔街对AI的乐观情绪还在狂热飙涨!不过,老黄却担忧起来了……
排名超过Llama-3-70B,英伟达Nemotron-4 340B问鼎竞技场最强开源模型!