RTX 4090可跑、完全开源,最快视频生成模型问世,实测一言难尽

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
RTX 4090可跑、完全开源,最快视频生成模型问世,实测一言难尽
5659点击    2024-11-24 20:20

开源 AI 视频社区又一个重量级选手下场。


这个周末,押注开源人工智能视频的初创公司 Lightricks,有了重大动作。


该公司推出了最快的视频生成模型 LTX-Video,它是首个可以实时生成高质量视频的 DiT 视频生成模型


RTX 4090可跑、完全开源,最快视频生成模型问世,实测一言难尽


在一块 Nvidia H100 上,LTX-Video 只需要 4 秒就能生成 5 秒时长的 24FPS 视频,分辨率 768x512,可以说视频生成速度比视频观看速度还要快。同时 LTX-Video 完全开源,包括代码库和模型权重。


RTX 4090可跑、完全开源,最快视频生成模型问世,实测一言难尽

LTX-Video共同作者和负责人。


「有史以来最快的文生视频模型诞生了。」


RTX 4090可跑、完全开源,最快视频生成模型问世,实测一言难尽


首先来看几个视频生成官方 Demo。


RTX 4090可跑、完全开源,最快视频生成模型问世,实测一言难尽


RTX 4090可跑、完全开源,最快视频生成模型问世,实测一言难尽


RTX 4090可跑、完全开源,最快视频生成模型问世,实测一言难尽


目前,用户可以在 GitHub Hugging Face 上体验预览版 LTX Video。完整版发布之后将免费供个人和商业使用,并即将集成到 LTX Studio 中。


RTX 4090可跑、完全开源,最快视频生成模型问世,实测一言难尽


项目地址:https://github.com/Lightricks/LTX-Video


我们尝试生成了两个视频,比如「a dog chasing a boy who is skateboarding」。


RTX 4090可跑、完全开源,最快视频生成模型问世,实测一言难尽


再比如「a girl with an umbrella standing on a bridge, and a handsome man walking towards her」。


RTX 4090可跑、完全开源,最快视频生成模型问世,实测一言难尽


试用地址:https://huggingface.co/spaces/akhaliq/anychat


接着来了解一下 LTX-Video 的细节。


LTX Video 是一个文本到视频和图像到视频模型,能够以惊人的速度和精度实时创建动态视频。该模型可以在 RTX 4090 等消费级 GPU 上本地运行,无需专用设备即可以低成本地生成高质量视频。


另外,LTX Video 基于开发人员的反馈和真实世界用例构建,可以提供自然逼真的结果。该模型做了高级定制化设计,可以流畅地集成各种外部工具,从而轻松地增强工作流。


在生成过程中,LTX Video 最大程度减少了闪烁和伪影,创建出具有出色细节和清晰度的高保真视频。每一帧都在精心制作下呈现清晰锐利、栩栩如生,符合用户的视觉效果。


最后,LTX Video 实现了无缝的跨帧一致性,从角色到环境,可以保持连贯的视觉效果,将每个细节整合在一起。


未来,LTX-Video 还会有技术报告放出。


RTX 4090可跑、完全开源,最快视频生成模型问世,实测一言难尽


文章来自于微信公众号 “机器之心”


RTX 4090可跑、完全开源,最快视频生成模型问世,实测一言难尽


关键词: AI , AI视频 , Lightricks , LTX-Video
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)