AI资讯新闻榜单内容搜索-AI音频

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: AI音频
SALMONN 系列音视频理解大模型霸榜回归!推理增强、高帧率、无文本泄漏全线突破

SALMONN 系列音视频理解大模型霸榜回归!推理增强、高帧率、无文本泄漏全线突破

SALMONN 系列音视频理解大模型霸榜回归!推理增强、高帧率、无文本泄漏全线突破

全新一代 video-SALMONN 2/2+、首个开源推理增强型音视频理解大模型 video-SALMONN-o1(ICML 2025)、首个高帧率视频理解大模型 F-16(ICML 2025),以及无文本泄漏基准测试 AVUT(EMNLP 2025) 正式发布。新阵容在视频理解能力与评测体系全线突破,全面巩固 SALMONN 家族在开源音视频理解大模型赛道的领先地位。

来自主题: AI资讯
6424 点击    2025-09-30 10:44
腾讯混元最新开源:一键生成电影级音效,性能表现全面SOTA

腾讯混元最新开源:一键生成电影级音效,性能表现全面SOTA

腾讯混元最新开源:一键生成电影级音效,性能表现全面SOTA

自带声音的视频生成模型,开源版开卷! 最新赶到的是腾讯混元:刚刚正式开源端到端的视频音效生成模型HunyuanVideo-Foley。

来自主题: AI资讯
7066 点击    2025-08-29 12:12
NotebookLM能生成PPT了,还带演讲配音

NotebookLM能生成PPT了,还带演讲配音

NotebookLM能生成PPT了,还带演讲配音

打工人超超超实用利器来了!还在自己苦巴巴地做汇报,干巴巴地念PPT么? 谷歌NotebookLM最新功能,只需要输入数据、图表、旁白,就可以自动生成带AI音频的PPT,甚至不需要自己去讲。

来自主题: AI资讯
6469 点击    2025-08-09 16:50
华强北AI眼镜:最低78元,“闪电出货”

华强北AI眼镜:最低78元,“闪电出货”

华强北AI眼镜:最低78元,“闪电出货”

华强北推出低价AI眼镜,价格78-450元,截胡小米、Rokid等巨头产品。产品分为AI拍摄眼镜和AI音频眼镜,功能基础但销量火爆,月均数千台。厂商快速组装出货,靠价格优势和即买即得吸引消费者尝鲜,性能虽逊但性价比高。行业前景存疑,技术成熟需5年,海外市场更受欢迎。

来自主题: AI资讯
7418 点击    2025-07-19 10:18
Mistral发布首款开源AI音频模型Voxtral​

Mistral发布首款开源AI音频模型Voxtral​

Mistral发布首款开源AI音频模型Voxtral​

随着 AI 系统越来越强大,人们与机器的交流方式也在发生变化。语音,正在迅速成为默认的交互入口。

来自主题: AI资讯
6810 点击    2025-07-16 16:32
喜马拉雅押注AI两年但很难变现,知情人称“落实得变形了”

喜马拉雅押注AI两年但很难变现,知情人称“落实得变形了”

喜马拉雅押注AI两年但很难变现,知情人称“落实得变形了”

AI不是万能解药 作为中国最大的在线音频平台,喜马拉雅又传出要 “ 卖身 ” 的消息了,据传腾讯音乐打算通过现金+股票的方式收购喜马拉雅。

来自主题: AI资讯
7713 点击    2025-06-11 11:39
速递|Stability AI联手Arm推出最快手机端免云模型,8秒生成11秒音频

速递|Stability AI联手Arm推出最快手机端免云模型,8秒生成11秒音频

速递|Stability AI联手Arm推出最快手机端免云模型,8秒生成11秒音频

AI 初创公司 Stability AI 发布了名为 Stable Audio Open Small 的“立体声”音频生成 AI 模型,该公司宣称这是市场上速度最快的模型,且效率高到足以在智能手机上运行。

来自主题: AI资讯
8434 点击    2025-05-15 14:14