
AI音效90秒长时可控生成!“狼嚎2秒,蟋蟀鸣8秒”精准搞定!清华&生数科技新研究入选ACM MM 2025
AI音效90秒长时可控生成!“狼嚎2秒,蟋蟀鸣8秒”精准搞定!清华&生数科技新研究入选ACM MM 2025文生音频系统最新突破,实现精确时间控制与90秒长时音频生成!
文生音频系统最新突破,实现精确时间控制与90秒长时音频生成!
以前常说「要把自己活成一支队伍」,如今感谢 AI,真的实现了。 最近,生数科技旗下 AI 视频模型 Vidu Q1 推出参考生功能,极大简化传统内容生产流程,真正实现「一个人就是一个剧组」!
这里介绍一下Vidu,Vidu是由生数科技联合清华大学正式发布的中国首个长时长、高一致性、高动态性视频大模型。Vidu在语义理解、推理速度、动态幅度等方面具备领先优势,并上线了全球首个“多主体参考”功能,突破视频模型一致性生成难题,开启了视觉上下文时代。最近上线了 Vidu Q1 的高质量视频大模型,不仅视频效果质感更高,而且性价比很不错。
多模态生成技术持续突破内容创作的边界。
3月12日,华尔街见闻获悉,原字节跳动AI大将、火山引擎高管骆怡航于近日加入生数科技,担任CEO一职。去年底,字节TikTok算法负责人陈志杰也被曝出离职创业。
如果从今年10月份开始算,截止到现在,视觉中国股价已经翻了一倍多。有点2022年底GPT概念股的架势。不过,视觉中国的涨停可不是靠概念,而是靠AI项目合作换来的。基于社区、场景和数据优势,目前国内包括智谱、通义千问、可灵AI、即梦AI、生数科技(Vidu)、爱诗科技(Pixverse)等几乎所有主流文生视频平台都接入了视觉中国。
本期我们有幸邀请到生数科技工程副总裁(VP)陈鑫与百度智能云AI计算部副总经理兰宇,深度解析Vidu这款视频大模型从发布到在行业内爆火的背后故事。
Sora 终于来了! 只要是 ChatGPT Plus/Pro 用户,直接就能用上。 至于效果 ...... 看完官方放出的 demo,网友大呼:不太行 !
继9月份版本更新之后,光锥智能从生数科技联合创始人兼CEO唐家渝朋友圈获悉,Vidu大模型将于本周再次进行版本升级,Vidu-1.5版本即将上线。
在 2024 云栖大会上,阶跃星辰创始人姜大昕、月之暗面Kimi创始人杨植麟、生数科技首席科学家朱军与极客公园创始人张鹏一起,探讨了各自眼中 AI 技术发展的现状,推演未来 18 个月,大模型行业会发生什么。 在这场圆桌里,他们重点聊了: