
在AI工具间来回切换了1年后,可灵用一张画布终结了它。
在AI工具间来回切换了1年后,可灵用一张画布终结了它。这次去WAIC,论坛、探展直播、活动等等,硬生生干了个周末,几乎累麻了。 我自己这两天印象最深的,也是我觉得对我最有用的。 还是可灵的更新。
这次去WAIC,论坛、探展直播、活动等等,硬生生干了个周末,几乎累麻了。 我自己这两天印象最深的,也是我觉得对我最有用的。 还是可灵的更新。
最近,大厂集体盯上了下一块肥肉:短剧。 小米REDMI首部短剧《时空合伙人》完结,并“隆重感谢”雷军特别出演。
爱刷短视频的朋友或许能够察觉到,今年的短视频平台和往年相比,AI内容正以势不可挡的力量席卷整个平台。
近期,夸克技术团队和浙江大学联合开源了OmniAvatar,这是一个创新的音频驱动全身视频生成模型,只需要输入一张图片和一段音频,OmniAvatar即可生成相应视频,且显著提升了画面中人物的唇形同步细节和全身动作的流畅性。此外,还可通过提示词进一步精准控制人物姿势、情绪、场景等要素。
前不久看到群里的聊天,正好聊到用纳米AI做视频很方便,当时太忙了没来得及体验,隔了一周后,在我好友小熊猫Loki群里再次看到了朋友Hank给吴老师做的视频成品,是个制作精良的小动画,画面、配音、节奏都不错。感觉真的很有趣,于是我花了几天体验了一下纳米AI。
AI短剧呈现三大内容演化阶段:从早期炫技式奇观转向动物拟人化共鸣,再到抽象癫剧与古偶拼贴。其内容趋近成熟并尝试IP化
最近测Agent测的非常上头, 而且越来越发现AI在各种专门的领域的垂直能力发展的越来越好了。
白鲸出海联合点点数据、非凡产研发布第 6 期全球 AI 教育产品榜(包含 App 和 Web 端,前 5 期可参考底部推荐文章)。本期我们延续上一期,将 5 大分类归类为语言学习、数学&综合、学习/教学工具&儿童教育(目前这 2 类产品较少暂归在一起),三大板块进行分析,但具体产品的分类标准与往期一致。
世界首个实时AI扩散视频模型炸场,Karpathy亲自站台,颠覆AI视频交互,0延迟+无限时长,每秒24帧不卡顿,MirageLSD首次实现AI直播级生成。
我们提出了 PresentAgent,一个能够将长篇文档转化为带解说的演示视频、多模态智能体。现有方法大多局限于生成静态幻灯片或文本摘要,而我们的方案突破了这些限制,能够生成高度同步的视觉内容和语音解说,逼真模拟人类风格的演示。