ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
一点不夸张,快手“可灵”可能比 Sora 还强|AI横评
8032点击    2024-06-13 20:47

快手近期上线了“可灵”大模型,据说视频生成的效果直接吊打一众国产,直逼Sora!甚至在有些细节超越了Sora!看到官网发布的视频????


可灵支持生成长达2分钟的视频,且帧率达到30fps。更是发布即上线,直接可以“快影”中申请内测,即可体验。我们非常荣幸获得了“可灵”的内测机会,马不停蹄的前来测试!


先来给大家看两个官方发布的视频比对:



可灵AI生成



Vidu生成



可灵AI生成



Sora生成


从实际体验来看,“可灵”和Sora相比视频效果也基本不相上下。


因为可灵现在是开放测试完全能用的,所有人都可以在快影App 上申请。所以我现在反而怀疑,Sora 能不能达到可灵这样的程度了。


今天就让可灵Pikaruaway Gen-2(两个目前市面已上线且最火的视频生成大模型)对比一下。


1

 远景视频


prompt:海啸席卷了全球,冲塌了房子,海上一片废墟,高清画质



可灵



Pika



Runway Gen-2


prompt:城市中的高楼大厦变成了废墟,到处都是浓烟弥漫,烈火焚烧



可灵



Pika



Runway Gen-2


可灵视频生成效果真实感最强,无论是海啸的波涛汹涌还是浓烟滚滚的战场,完全符合物理学规律;其次是Runway Gen-2,画面内容比较单一,只有浓烟;Pika生成的效果不佳,火焰像是贴图,并没有和楼融为一体。


1

 人物特写


prompt:美女吃播,吃炸鸡



可灵



Pika



Runway Gen-2

视频人物生成方面完全不在同一层次了。可灵的生成效果最佳,基本上分辨不出是实拍还是 AI 生成的;Runway Gen-2和Pika 半斤八两,既没有发生“吃”这个动作,画面的变形、扭曲和错误也是铺满了屏幕。


1

 动物特写


prompt:一只白色的中国田园猫和一只成年的拉布拉多一起趴在客厅沙发旁边的灰色地毯上玩闹,丰富细节,写实风格,氛围光照



可灵



Pika



Runay Gen-2


prompt:一只兔子警官和一只穿着衬衫戴着墨镜的狐狸,冰淇淋店里在自拍,超现实主义,动漫风格,3D



可灵



Pika



Runway Gen-2

动物生成,第一名可灵,背景和动物的神态动作都十分真实,猫狗之间的互动也是符合真实的情况;第二名Runway Gen-2,视频首图还可以,老问题就是不能“动起来”;第三名Pika,第一组视频中狗狗直接失踪,猫的骨骼严重畸形,但第二组视频中非常符合尼克和朱迪的形象,在训练素材中大概率是有疯狂动物城。


1

 快速特效镜头


prompt:飞船进入一个旋转的虫洞,周围星光扭曲,时间与空间似乎在这一刻凝固。



可灵



Pika



Runway Gen-2

第一名可灵特效镜头画面比较稳定,第一视角快速穿梭,沉浸感十足;第二名Runway Gen-2画面运动缓慢,且有变形;第三名Pika视频生成和prompt有出入。


 《钢铁侠大战哥斯拉》混剪



 总结


通过以上测试可以看出可灵生成的视频无论是远景、近景,人物,动物还是特效视频,它都可以深入理解prompt并保持稳定输出,直接吊打Runway Gen-2Pika


但是可能因为处于内测阶段,可灵一次只能生成5秒的视频,期待之后正式发布可以生成一次可以生成两分钟的视频。


目前可灵大多数生成的视频,基本完全可以以假乱真了。



Sora如果再不上线,这个市场很有可能就被快手可灵抢先一步占领了。家人们,给我们可灵点点赞。


文章来源于:硅星人pro,作者:丸丸柚贝


关键词: sora , AI视频 , 可灵 , 视频大模型
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0