有了 Suno 这个「作曲助手」,人人都可以创建自己想听的歌曲。自从 ChatGPT 在 2022 年底爆火以来,我们已经看到 AI 生成的诸多艺术创作成果:ChatGPT 写出过情节引人入胜的网文,Midjourney 生成过肉眼难辨的人像。
有了 Suno 这个「作曲助手」,人人都可以创建自己想听的歌曲。自从 ChatGPT 在 2022 年底爆火以来,我们已经看到 AI 生成的诸多艺术创作成果:ChatGPT 写出过情节引人入胜的网文,Midjourney 生成过肉眼难辨的人像。
这两天,ElevenLabs 紧随着自己融资 8000 万的新闻,在 X 上接连发了一则招聘启事和一条宣传片,以将自己的团队规模,从 40 人扩大到 100 人。
香港中文大学(深圳)数据科学学院武执政副教授团队联合上海人工智能实验室 OpenMMLab 团队开源了综合音频生成项目 Amphion(安菲翁)。该系统旨在打造一个集语音合成转换、歌声合成转换、音效音乐生成等多功能为一体的开源平台。
AI技术的应用,为我们的生活带来巨大变化。当AI技术应用到声音领域,是否面临侵权风险?司法又将如何回应?12月12日,北京互联网法院首次组成五人合议庭,依法公开审理全国首例“AI声音侵权案”。
12月14日,谷歌推出AI音乐创作工具“MusicFX”,仅需几句话,用户即可生成原创的音乐作品。
本文介绍了一个名为Alph-CLIP的框架,它在原始的接受RGB三通道输入的CLIP模型的上额外增加了一个alpha通道。在千万量级的RGBA-region的图像文本对上进行训练后,Alpha-CLIP可以在保证CLIP原始感知能力的前提下,关注到任意指定区域。通过替换原始CLIP的应用场景,Alpha-CLIP在图像识别、视觉-语言大模型、2D乃至3D生成领域都展现出强大作用。
最近,来自南大等机构的研究人员开发了一个通用的框架,用一段音频就能让照片上的头像讲多国语言。不论是头部动作还是嘴型都非常自然,看到很多不错的
近日,音乐博主“麦田农夫”通过专业软件进行分析,质疑知名乐队五月天在上海演唱会的音频中部分歌曲为假唱或真假混唱。12月4日,相信音乐公司发表声明称,“五月天在巡回演出中不存在任何假唱行为”,并表示正积极配合相关执法部门开展调查工作。
披头士乐队(the Beatles)上线了他们的“新”歌。上线的这首 Now And Then,是因为用上了 AI,才让原本音源质量不佳而被搁置 30 年的 demo,得到重生。
近期大火的FPS新作《The Finals》开发商Embark Studios确认游戏中大部分配音都是由人工智能工具来生成的,包括所有参赛选手、解说员的声音等。只有少数的呼吸声、跳跃声是在录音室录制的,因为人工智能还不能完成这些任务。