AI资讯新闻榜单内容搜索-Audio

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
搜索: Audio
全球最大开源视频模型,现在也Created in China了,阶跃出品

全球最大开源视频模型,现在也Created in China了,阶跃出品

全球最大开源视频模型,现在也Created in China了,阶跃出品

刚刚,阶跃星辰联合吉利汽车集团,开源了两款多模态大模型!新模型共2款:全球范围内参数量最大的开源视频生成模型Step-Video-T2V行业内首款产品级开源语音交互大模型Step-Audio多模态卷王开始开源多模态模型,其中Step-Video-T2V采用的还是最为开放宽松的MIT开源协议,可任意编辑和商业应用。

来自主题: AI资讯
6910 点击    2025-02-18 14:43
ICLR 2025 Spotlight:音频生成新突破!港科北邮团队首次通过文本控制声源方向生成音频

ICLR 2025 Spotlight:音频生成新突破!港科北邮团队首次通过文本控制声源方向生成音频

ICLR 2025 Spotlight:音频生成新突破!港科北邮团队首次通过文本控制声源方向生成音频

兔子通过两只耳朵可以准确感知捕食者的一举一动,造就了不同品种广泛分布在世界各地的生命奇迹;同样人也需要通过双耳沉浸式享受电影视听盛宴、判断驾驶环境和感知周围活动状态。

来自主题: AI技术研报
7045 点击    2025-02-15 15:23
NotebookLM为什么可以生成更加自然的对话?谷歌官方公布背后的技术细节

NotebookLM为什么可以生成更加自然的对话?谷歌官方公布背后的技术细节

NotebookLM为什么可以生成更加自然的对话?谷歌官方公布背后的技术细节

DeepMind 公布其正在开发一套创新的音频生成技术细节,也就是NotebookLM背后使用的语音技术。使 AI 能够生成更加自然的对话和高质量的音频。这些技术不仅提升了语音助手的交互性,还帮助多种应用在语音合成和对话生成上取得更大进展。

来自主题: AI技术研报
3861 点击    2024-10-31 15:26
腾讯的 EzAudio AI 将文本转换为逼真的声音,引发创新和辩论

腾讯的 EzAudio AI 将文本转换为逼真的声音,引发创新和辩论

腾讯的 EzAudio AI 将文本转换为逼真的声音,引发创新和辩论

来自约翰斯·霍普金斯大学和腾讯AI实验室的研究人员推出了EzAudio,这是一种新的文本到音频(T2A)生成模型,承诺以前所未有的效率从文本提示中生成高质量的音效。这一进步标志着人工智能和音频技术的重大飞跃,解决了人工智能生成音频中的几个关键挑战。

来自主题: AI资讯
6297 点击    2024-10-08 19:01
火爆全球的AI音频大模型,最新技术细节揭秘

火爆全球的AI音频大模型,最新技术细节揭秘

火爆全球的AI音频大模型,最新技术细节揭秘

Stable Audio Open:开源文本转音频模型。

来自主题: AI资讯
3015 点击    2024-07-25 11:09
阿里音频生成大模型一次发俩还开源!50种语言快速理解+5种语言语音生成,带情感的那种

阿里音频生成大模型一次发俩还开源!50种语言快速理解+5种语言语音生成,带情感的那种

阿里音频生成大模型一次发俩还开源!50种语言快速理解+5种语言语音生成,带情感的那种

OpenAI迟迟不上线GPT-4o语音助手,其它音频生成大模型成果倒是一波接着一波发布,关键还是开源的。

来自主题: AI资讯
10144 点击    2024-07-06 20:21
Stability AI开源47秒音频生成模型,虫鸣鸟叫、摇滚、鼓点都能生成

Stability AI开源47秒音频生成模型,虫鸣鸟叫、摇滚、鼓点都能生成

Stability AI开源47秒音频生成模型,虫鸣鸟叫、摇滚、鼓点都能生成

音频生成领域又有好消息:刚刚,Stability AI 宣布推出开放模型 Stable Audio Open,该模型能够生成高质量的音频数据。

来自主题: AI资讯
8331 点击    2024-06-07 10:40