AI资讯新闻榜单内容搜索-TTS

憋了4个月，阿里最大最强模型Qwen3-Max-Thinking正式版发布！附一手实测

阿里巴巴推出了Qwen3-Max-Thinking，这是阿里千问系列目前能力最强的旗舰级推理模型，在19项权威基准测试中，Qwen3-Max-Thinking跟GPT-5.2-Thinking、Claude-Opus-4.5和Gemini 3 Pro等顶尖模型打得有来有回，搭配测试时扩展（TTS）能力后，能在不少基准测试上达到SOTA。

来自主题: AI资讯

11038 点击 2026-01-27 11:21

微软发布首个测试时扩展大规模研究，还给出了终极指南

如果说大模型的预训练（Pre-training）是一场拼算力、拼数据的「军备竞赛」，那么测试时扩展（Test-time scaling, TTS）更像是一场在推理阶段进行的「即时战略游戏」。

来自主题: AI技术研报

8191 点击 2025-12-11 11:27

NeurIPS 2025 | DynaAct：DeepSeek R1之外，探索大模型推理的另一条道路

大模型推理的爆发，实际源于 scaling 范式的转变：从 train-time scaling 到 test-time scaling（TTS），即将更多的算力消耗部署在 inference 阶段。典型的实现是以 DeepSeek r1 为代表的 long CoT 方法：通过增加思维链的长度来获得答案精度的提升。那么 long CoT 是 TTS 的唯一实现吗？

来自主题: AI技术研报

9328 点击 2025-11-30 09:30

扩展外部测试时Scaling Law，中关村学院新发现：轻量级验证器可解锁LLM推理最优选择

在大语言模型（LLM）席卷各类复杂任务的今天，“测试时扩展”（Test-Time Scaling，TTS）已成为提升模型推理能力的核心思路 —— 简单来说，就是在模型 “答题” 时分配更多的计算资源来让它表现更好。严格来说，Test-Time Scaling 分成两类：

来自主题: AI技术研报

8629 点击 2025-11-06 14:59

让 AI 开口「像人」：最难的不是智能，是「嗓音」

Voice Agent 赛道正在爆发，但它迫切需要一个能让对话真正「流动起来」的底层引擎，一个能撑起下一代交互体验的 TTS 模型。竞争的焦点，已经从 LLM 的「大脑」，延伸到了 TTS 的「嗓音」。谁掌握嗓音，谁就掌握着下一代 AI 商业化的钥匙。而 10 月 30 日 MiniMax 发布的 Speech 2.6 模型，似乎正是一个专为解决这些痛点而来的答案。

来自主题: AI资讯

9773 点击 2025-10-31 15:35

清华&巨人网络首创MoE多方言TTS框架，数据代码方法全开源

无论是中文的粤语、闽南话、吴语，还是欧洲的荷兰比尔茨语方言、法国奥克语，亦或是非洲和南美的地方语言，方言都承载着独特的音系与文化记忆，是人类语言多样性的重要组成部分。然而，许多方言正在快速消失，语音技术如果不能覆盖这些语言，势必加剧数字鸿沟与文化失声。

来自主题: AI技术研报

9243 点击 2025-10-16 12:08

跳出套路、月入百万，这家公司验证了“AI+声音”的另一种赚钱方式

在我们往期观察“AI+声音”的应用中，多是 TTS、AI 生成播客和读书/配音等方向，先有文字内容、后转化为声音输出的偏“工具”类产品。当大多数产品在探索如何用 AI 声音改变内容传播的形式时，一家德国厂商却在另一个方向持续耕耘，并且维持了不错的流水表现。

来自主题: AI资讯

10048 点击 2025-09-30 16:35

阿里一夜扔出三个开源王炸！猛刷32项开源SOTA

深夜，阿里通义大模型团队连放三个大招：开源原生全模态大模型Qwen3-Omni、语音生成模型Qwen3-TTS、图像编辑模型Qwen-Image-Edit-2509更新。Qwen3-Omni能无缝处理文本、图像、音频和视频等多种输入形式，并通过实时流式响应同时生成文本与自然语音输出。

来自主题: AI资讯

9886 点击 2025-09-23 16:33

没想到，音频大模型开源最彻底的，居然是小红书

不难发现，近几个月，开源频频成为 AI 社区热议的焦点。尤其是对于国内科技公司来说，开源成为主旋律。根据 Hugging Face 中文 AI 模型与资源社区的数据显示，国内厂商在七八月接连开源 33 款、31 款各类型大模型。

来自主题: AI资讯

11180 点击 2025-09-19 09:22

B站出海的强有力支柱：最新开源文本转语音模型IndexTTS-2.0标志零样本TTS进入双维度时代

最近在 B 站上，你是否也刷到过一些 “魔性” 又神奇的 AI 视频？比如英文版《甄嬛传》、坦克飞天、曹操大战孙悟空…… 这些作品不仅完美复现了原角色的音色，连情感和韵律都做到了高度还原！更让人惊讶的是，它们居然全都是靠 AI 生成的！

来自主题: AI技术研报

9138 点击 2025-09-18 15:54