AI资讯新闻榜单内容搜索-生成模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 生成模型
长视频AI数字人来了!字节×浙大推出商用级音频驱动数字人模型InfinityHuman

长视频AI数字人来了!字节×浙大推出商用级音频驱动数字人模型InfinityHuman

长视频AI数字人来了!字节×浙大推出商用级音频驱动数字人模型InfinityHuman

随着内容创作智能化需求的爆发,长时长、高质量数字人视频生成始终是行业痛点。近日,字节跳动商业化 GenAI 团队联合浙江大学推出商用级长时序音频驱动人物视频生成模型 ——InfinityHuman,打破传统音频驱动技术在长视频场景中的局限性,开启 AI 数字人实用化新征程

来自主题: AI技术研报
5344 点击    2025-09-04 15:22
腾讯混元最新开源:一键生成电影级音效,性能表现全面SOTA

腾讯混元最新开源:一键生成电影级音效,性能表现全面SOTA

腾讯混元最新开源:一键生成电影级音效,性能表现全面SOTA

自带声音的视频生成模型,开源版开卷! 最新赶到的是腾讯混元:刚刚正式开源端到端的视频音效生成模型HunyuanVideo-Foley。

来自主题: AI资讯
6520 点击    2025-08-29 12:12
告别「面瘫」配音,InfiniteTalk开启从口型同步到全身表达新范式

告别「面瘫」配音,InfiniteTalk开启从口型同步到全身表达新范式

告别「面瘫」配音,InfiniteTalk开启从口型同步到全身表达新范式

传统 video dubbing 技术长期受限于其固有的 “口型僵局”,即仅能编辑嘴部区域,导致配音所传递的情感与人物的面部、肢体表达严重脱节,削弱了观众的沉浸感。现有新兴的音频驱动视频生成模型,在应对长视频序列时也暴露出身份漂移和片段过渡生硬等问题。

来自主题: AI技术研报
6925 点击    2025-08-28 14:32
空间智能卡脖子难题被杭州攻克!难倒GPT-5后,六小龙企业出手了

空间智能卡脖子难题被杭州攻克!难倒GPT-5后,六小龙企业出手了

空间智能卡脖子难题被杭州攻克!难倒GPT-5后,六小龙企业出手了

最近3D内容生成模型好生热闹,像谷歌Genie 3、World Labs、混元、昆仑争相发布并开测世界模型。

来自主题: AI资讯
7148 点击    2025-08-27 18:50
AI视频生成新品实测:这怎么不算影院级呢?

AI视频生成新品实测:这怎么不算影院级呢?

AI视频生成新品实测:这怎么不算影院级呢?

百度最新视频生成模型蒸汽机2.0(MuseSteamer 2.0),好像真的有点东西。

来自主题: AI产品测评
5271 点击    2025-08-26 18:52
多人有声视频一体化生成!用百度最新AI生成营销视频,现在1.4元/5秒

多人有声视频一体化生成!用百度最新AI生成营销视频,现在1.4元/5秒

多人有声视频一体化生成!用百度最新AI生成营销视频,现在1.4元/5秒

最初说不做视频生成模型的百度,现在在视频生成的路上一路狂奔! 就在刚刚,百度蒸汽机(MuseSteamer)视频生成大模型升级至2.0版本,主打多人有声音视频一体化生成。

来自主题: AI资讯
7088 点击    2025-08-22 11:32
刚刚,好莱坞特效师展示AI生成的中文科幻大片,成本只有330元

刚刚,好莱坞特效师展示AI生成的中文科幻大片,成本只有330元

刚刚,好莱坞特效师展示AI生成的中文科幻大片,成本只有330元

多模态的生成,是 AI 未来的方向。 最近,AI 领域的气氛正在发生微妙的变化。比如,刚刚推出了 Grok 4 的 xAI 却在重点宣传他们的视频生成模型 Grok Image。

来自主题: AI资讯
5254 点击    2025-08-22 09:19
上下文记忆力媲美Genie3,且问世更早:港大和可灵提出场景一致的交互式视频世界模型

上下文记忆力媲美Genie3,且问世更早:港大和可灵提出场景一致的交互式视频世界模型

上下文记忆力媲美Genie3,且问世更早:港大和可灵提出场景一致的交互式视频世界模型

要让视频生成模型真正成为模拟真实物理世界的「世界模型」,必须具备长时间生成并保留场景记忆的能力。然而,交互式长视频生成一直面临一个致命短板:缺乏稳定的场景记忆。镜头稍作移动再转回,眼前景物就可能「换了个世界」。

来自主题: AI技术研报
6232 点击    2025-08-21 11:25
6秒造一个「视频博主」,Pika让一切图片开口说话

6秒造一个「视频博主」,Pika让一切图片开口说话

6秒造一个「视频博主」,Pika让一切图片开口说话

制作一个视频需要几步?可以简单概括为:拍摄 + 配音 + 剪辑。 还记得 veo3 发布时引起的轰动吗?「音画同步」功能的革命性直接把其他视频生成模型按在地上摩擦,拍摄 + 配音 + 粗剪一键搞定。

来自主题: AI资讯
5969 点击    2025-08-13 16:59