ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
AI 视频生成工具 Vidu 试用:细节处理还需加强
2563点击    2024-09-08 11:23


看过了 AI 视频生成工具清影的试用体验,今次我们来测试什么产品呢?就是此前上线的号称“首个国产纯自研视频大模型”的 Vidu (https://www.vidu.studio/)。该平台目前开放了文生视频、图生视频两大核心功能,提供 4 秒和 8 秒两种时长选择。


据介绍,Vidu 在构图、叙事和光影等方面,能达到接近电影级效果。那么 Vidu 的表现究竟如何,还请往下看我们的试用体验了。


界面与功能



Vidu 目前提供网页端应用,其操作界面非常简单,功能仅为上传图片生成视频以及文字描述生成视频两大项。整体界面呈深色模式,主页面的左侧为编辑区域,右侧为生成结果&历史记录。


新用户注册可获赠 80 积分用于生成视频(一次消耗 4 积分)。你也可以选择订阅以获取更多积分,以及 8 秒视频生成权限、去水印、优先生成、任务并行以及视频支持商用等权益。


视频风格可选写实、动画;时长可选 4/8 秒(8 秒版本需要订阅),而生成高清版需要再花费 4 积分。生成的视频支持下载与分享链接。Vidu 目前暂未提供作品社区供用户交流。


试用体验


我们首先尝试图片+简单文字描述形式。第一次我们使用网络较火的《师傅你是做什么工作的》梗图,外加描述“画面中的人物从梯子上下来,与一个路人握手”,生成结果如下(高清版):https://www.vidu.studio/share/2415124584287690/328016。可以看到握手时手部细节动作出现明显错误。


师傅你是做什么工作的?


第二次,我们直接以文字描述形式来测试,输入描述文字:恐怖风格,一只直立行走的人形泰迪熊身着黑色晚礼服,头戴黑色礼帽,它的怀里抱着一枝花盆,花盆里有一只盛开的红色玫瑰。泰迪熊朝着镜头走来,天空阴沉,即将打雷闪电下暴雨。(视频链接:https://www.vidu.studio/share/2415135561777105/747915)



结果泰迪熊直接行走高空,难道他才是真正的“天命人”?


第三个案例我们使用的描述文字为:浪漫风格,一对情侣拥抱后牵手。他们身处霓虹灯闹市的十字路口,正在等人行道红灯。他们身旁路过的人似乎没有注意到他们的存在。(视频链接:https://www.vidu.studio/share/2415141016288514/782732)


同样,男士的右手明显出错——手心秒变手背。



最后我们尝试官方提供的随机描述词功能(视频链接:https://www.vidu.studio/share/2415142426369345/804767),可以感觉到官方选定的描述文字生成的视频似乎更“完美”,背后的 AI 或许经过专门调整。真相是否如此不得而知,但作为打样参考一下也未尝不可。



关于生成时间,首次尝试排队大概等待两分钟,生成速度倒是较快。第二、三次尝试用文字生成视频,几乎没有排队时间,直接进入生成阶段。总体速度很快,这一点令人满意。


总结


Vidu 是一款易上手的 AI 视频生成工具,但想要得到满意结果,恐怕你需要查阅并深入学习官方使用指南,给出一段语句严谨、富有影视创造性的描述,才能如愿。


在生成一些较为复杂的场景时,视频的细节处理还有些粗糙。体验时,我们多次遇到人物的手部细节问题,说明 Vidu 还需加强模型训练,并提高 AI 稳定性。


亮点


  • 视频生成时间快


  • 操作简便


不足


  • 视频频现违反现实规律的细节错误


  • 生成内容可能会涉及版权问题


p.s. 下周就是苹果发布会了,我们用 Vidu 生成了两段有关 iPhone 16 的视频,大家可以抢先预览一下!


这是库克吗?


为什么 Vidu 认为 iPhone 16 的主摄像头阵列长在屏幕上?


文章来自于“动点科技”,作者“Steven Lee”。


关键词: AI , AI视频 , Vidu , AI视频工具