ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
斯坦福AI视频生成工具免费开放!30秒时长,马斯克看了效果会沉默
6891点击    2024-06-20 23:16

将音频、图像、视频整合进同一工作流,这个由斯坦福初创公司发布的视频工具火了!


预览版支持生成30S逼真视频,网友们直呼不输Luma。


抢先看性转版马斯克激情说唱:



与Luma一样,目前这个名为Hedra的工具可以免费试用


在给大家带来一手实测前,再来看一波新鲜整活儿~


让面值10德国马克上的“数学王子”高斯自我介绍:



让石像说话、眨眼、摆动头部:6



生成虚拟土豆人角色:



让僵尸管家变换表情:



好了,鉴于近期翻车事件过多,让我们直接启动实测。


Hedra究竟如何?


Hedra目前可在桌面和移动设备使用,这里我们直接访问官网。



Hedra的目标是建立一个人人都可访问的多模式创作工作室,因此将音频、图像、视频都结合在了一起。


在音频部分,官方预置了6种音色,可以文字转音频,也可以直接上传音频文件。


然后输入你的角色描述,中间可以直接生成图像,当然也支持上传图像。


最后一键生成视频,以下为实测结果(约50秒时间生成了2秒视频)



顺便一提,一开始本来想传Sam Altman的图片,结果被官方识别为“名人”予以拒绝了。



除了以上小编实测,已经体验了Hedra的网友们也反馈了一大波实测结果。


而且官方挨个在线回应了,接下来一起瞅瞅~


有网友细心捕捉到了Hedra视频中的动漫人脸畸变情况。



不过在镜头拉近,类似特写时这种情况有所改善。



官方坦言,目前Hedra确实还在与非人类角色作斗争。



但是对于人兽混合的情况,官方表示效果还行,比如有网友生成了如下视频:



此外,也有网友提到了Hedra审核过严的问题。



网友想用以上3张及其他图像试着生成类似电影的片段,结果被系统判定为“名人”而拒绝生成。


该网友表示:


这些是AI生成的,不是名人。虽然安全很重要,但误判过多。

对此,官方多次回应后续会看情况调整



以上为网友提及率最高的两个问题,官方也在更多回复中透露了其他情况。


  • 无限时长(开放预览为30秒)

  • 每60秒生成90秒(如果官方H100供应充足)

  • 模型目前提供音频到视频,但正在扩展其他输入形式

  • 即将推出16:9的视频尺寸

  • 模型主要测试了中文和英文输入,且中文表现还不错

  • 模型目前提供API,可加入官方Discord

谁造出了Hedra?


Hedra此次发布的基础模型Character-1由前斯坦福大学顶尖研究团队领导。


首席执行官Michael Lingelbach,斯坦福大学前博士生,从事空间智能研究。



另一负责人Alex Bergman,同样来自斯坦福大学,研究领域包括计算成像、计算机视觉、计算机图形学和机器学习。



在谷歌学术页面,Alex Bergman发表或参与发表了数量颇丰的论文。



除了Hedra,最近几天视频生成工具正在迎来爆发期


有网友也借机整合了Hedra、Luma、elevenlabsio等不到1分钟制作了一个短片。



你觉得效果如何?欢迎在评论区分享使用反馈。


工具地址:


https://www.hedra.com/


Discord:


https://discord.com/invite/KXeUUa6cXD


参考链接:


https://x.com/HBCoop_/status/1803100686306972128


https://x.com/JDL4_/status/1803207271981150594


https://x.com/seirdotmk/status/1803127446364905512


https://x.com/Shane__Willett/status/1803204476473401603


https://x.com/danielpikl/status/1803149141326930050


https://x.com/amorvobiscum/status/1803142141260210436


https://x.com/janusch_patas/status/1803095423806062770


https://x.com/ammaar/status/1803112436284698819


文章来源于:微信公众号量子位,作者:一水


关键词: Hedra , AI , AI视频 , 斯坦福AI
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)