# 热门搜索 #
搜索
斯坦福AI视频生成工具免费开放!30秒时长,马斯克看了效果会沉默
6791点击    2024-06-20 23:16

将音频、图像、视频整合进同一工作流,这个由斯坦福初创公司发布的视频工具火了!


预览版支持生成30S逼真视频,网友们直呼不输Luma。


抢先看性转版马斯克激情说唱:



与Luma一样,目前这个名为Hedra的工具可以免费试用


在给大家带来一手实测前,再来看一波新鲜整活儿~


让面值10德国马克上的“数学王子”高斯自我介绍:



让石像说话、眨眼、摆动头部:6



生成虚拟土豆人角色:



让僵尸管家变换表情:



好了,鉴于近期翻车事件过多,让我们直接启动实测。


Hedra究竟如何?


Hedra目前可在桌面和移动设备使用,这里我们直接访问官网。



Hedra的目标是建立一个人人都可访问的多模式创作工作室,因此将音频、图像、视频都结合在了一起。


在音频部分,官方预置了6种音色,可以文字转音频,也可以直接上传音频文件。


然后输入你的角色描述,中间可以直接生成图像,当然也支持上传图像。


最后一键生成视频,以下为实测结果(约50秒时间生成了2秒视频)



顺便一提,一开始本来想传Sam Altman的图片,结果被官方识别为“名人”予以拒绝了。



除了以上小编实测,已经体验了Hedra的网友们也反馈了一大波实测结果。


而且官方挨个在线回应了,接下来一起瞅瞅~


有网友细心捕捉到了Hedra视频中的动漫人脸畸变情况。



不过在镜头拉近,类似特写时这种情况有所改善。



官方坦言,目前Hedra确实还在与非人类角色作斗争。



但是对于人兽混合的情况,官方表示效果还行,比如有网友生成了如下视频:



此外,也有网友提到了Hedra审核过严的问题。



网友想用以上3张及其他图像试着生成类似电影的片段,结果被系统判定为“名人”而拒绝生成。


该网友表示:


这些是AI生成的,不是名人。虽然安全很重要,但误判过多。

对此,官方多次回应后续会看情况调整



以上为网友提及率最高的两个问题,官方也在更多回复中透露了其他情况。


  • 无限时长(开放预览为30秒)

  • 每60秒生成90秒(如果官方H100供应充足)

  • 模型目前提供音频到视频,但正在扩展其他输入形式

  • 即将推出16:9的视频尺寸

  • 模型主要测试了中文和英文输入,且中文表现还不错

  • 模型目前提供API,可加入官方Discord

谁造出了Hedra?


Hedra此次发布的基础模型Character-1由前斯坦福大学顶尖研究团队领导。


首席执行官Michael Lingelbach,斯坦福大学前博士生,从事空间智能研究。



另一负责人Alex Bergman,同样来自斯坦福大学,研究领域包括计算成像、计算机视觉、计算机图形学和机器学习。



在谷歌学术页面,Alex Bergman发表或参与发表了数量颇丰的论文。



除了Hedra,最近几天视频生成工具正在迎来爆发期


有网友也借机整合了Hedra、Luma、elevenlabsio等不到1分钟制作了一个短片。



你觉得效果如何?欢迎在评论区分享使用反馈。


工具地址:


https://www.hedra.com/


Discord:


https://discord.com/invite/KXeUUa6cXD


参考链接:


https://x.com/HBCoop_/status/1803100686306972128


https://x.com/JDL4_/status/1803207271981150594


https://x.com/seirdotmk/status/1803127446364905512


https://x.com/Shane__Willett/status/1803204476473401603


https://x.com/danielpikl/status/1803149141326930050


https://x.com/amorvobiscum/status/1803142141260210436


https://x.com/janusch_patas/status/1803095423806062770


https://x.com/ammaar/status/1803112436284698819


文章来源于:微信公众号量子位,作者:一水


关键词: Hedra , AI , AI视频 , 斯坦福AI
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)