ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
拳打Sora、脚踢pika,MiniMax能讲好文本视频生成故事吗?|AI测评师
5279点击    2024-09-14 16:28

至少到现在,MiniMax还未收费。


如果你关注AIGC,前几天一定被一段丝滑的文本视频生成刷到过屏。


这是一支2分钟的短片,名为《魔法硬币》,由MiniMax视频生成大模型制作而成。故事是常规故事,一个少年因为拥有了魔法硬币,开始各种奇幻漂流,勇者斗恶龙。


单看视频,很容易被其惊艳:时长2分钟,用通俗画面讲了一个完整的故事;视频生成常见的怪诞感,也没有在魔法硬币中呈现,画面风格统一;除了生动画面外,配音、字幕一应俱全。


更重要的是,至少到目前,MiniMax还未收费。


免费的视频生成,不玩一下,怎么对得起测评师的称号?


这不,视频就来了。


这次,我们选取了一个耳熟能详的故事《白蛇传》:峨眉山千年蛇妖白素贞带着同类小青,为早日成仙,来到人间和书生许仙相恋,却被法海以斩妖除魔为名百般阻挠,无情拆散。最后白素贞为爱自愿走进雷峰塔,许仙在白娘子进入雷锋塔之后出家,每日为她扫塔,直到须髯皆白。


MiniMax生成视频


不知是不是因为故事太复杂, 还是视频只默认生成6秒,出来的效果并不如意。


比如:虽然是中文视频大模型,但似乎对中国神话故事并不了解,出现的蛇妖,与大众认知相距甚远;画面中出现了3名男子,无法判断角色到底是谁;文案里提到“白素贞为爱自愿走进雷峰塔”,但画面去呈现走出塔……


那是不是换成简单点的文案,MiniMax就能更好理解些呢?


于是,我们有准备了一个新的剧情:一个背着书包的男生,走进麦当劳,点了一份套餐后,和同学坐在一起学习。


不得不说,画面好了很多,但依旧有bug存在。比如中间的同学,明明拿着叉子,但是在吃书。


MiniMax生成视频


至少从目前尝试的两个视频来看,MiniMax并没有网友夸的那么好。


另外,MiniMax开放的版本,更接近于傻瓜式生成,娱乐性质更强,商业化还有距离。


官网截图


如果视频不行,那作一段音乐效果会不会好一些?


进入海螺音乐,我简单写了个曲目和歌词。


“海螺音乐”截图


歌词写了糙点,但问题不大,可以一键AI修改。


“海螺音乐”截图


是不是觉得押韵了许多,puchline出现不少。


音乐风格上,海螺音乐给出了流行、电子、都市等18个风格,每个曲风中,又可以选择不一样的调调。这些音乐风格都是由网友上传。


让我们来试听一下,以下几个版本。


 你们喜欢哪个版本?


从体验角度来说,音乐生成比画面生成有意思多了,或许是因为视频生成的难度还是大了点?


不过免费的音乐/视频,怎么着也得考虑版权问题。


作为一款合格的新手村大模型,想要体验AIGC视频/音乐生成的uus,不如来体验一下。


文章来自于“36氪”,作者“左键”。


关键词: AI , AI测评 , AI视频 , MiniMax