AI资讯新闻榜单内容搜索-TTS

TTS也要真人感！首个字级内容、毫秒级停顿控制的语音合成系统

语音合成这两年发展迅速：把一段话顺顺当当地念完，已经不算难事；难的是该慢的时候慢，该顿的时候顿，该强调的时候真能把重点托出来。

来自主题: AI技术研报

5680 点击 2026-05-13 10:00

小米双模型正式开源！MiMo-V2.5-Pro无中断肝出“macOS”：54个应用全开、浏览器真能冲浪

没错，用的就是主打长程任务、模糊指令遵循，跻身国产Agent第一梯队的小米MiMo‑V2.5 Pro。小米最新发布的MiMo‑V2.5系列，包含Pro旗舰Agent、全模态基座、TTS语音合成、ASR语音识别四大模型，综合实力对标国际顶尖水准。

来自主题: AI产品测评

6991 点击 2026-04-29 10:04

美团开源“语音克隆”模型，1B/3.5B双选，超自然复刻你的声音

相似度超越Seed-TTS、MiniMax-Speech等知名模型。昨晚，美团LongCat团队发布了文本转语音模型LongCat-AudioDiT，并开源1B、3.5B参数量的版本。这一模型的最大特点，是彻底抛弃了梅尔谱等中间表示，直接在波形潜空间进行基于扩散模型的文本转语音。通俗地说，这一模型直接根据声音本身的规律进行生成，“雕刻”出最原始的声音波形，从根源阻断数据转换的级联误差。

来自主题: AI资讯

8997 点击 2026-04-02 13:51

浙大团队破解多模态模型「盲目自信」：先校准置信度，再分配算力丨CVPR'26

多模态大模型，到底有多“嘴硬”？浙江大学联合阿里巴巴、香港城市大

来自主题: AI技术研报

7527 点击 2026-03-23 09:51

小米神操作！认领榜一神秘模型Hunter Alpha，龙虾之父都忍不住打听

占领OpenRouter调用量榜单第一的神秘模型Hunter Alpha，终于揭开神秘面纱—— 既不是GPT，也不是DeepSeek，而是来自小米的万亿旗舰模型MiMo-V2-Pro。

来自主题: AI资讯

9911 点击 2026-03-19 10:51

刚刚，被全网猜是DeepSeek V4的神秘大模型，被小米认领了！还能免费“养龙虾”

今日凌晨，小米MiMo大模型系列重磅三连更：旗舰基座大模型MiMo-V2-Pro、全模态Agent模型MiMo-V2-Omni、MiMo-V2-TTS，其最新发布的这三大模型都是为优化智能体能力打造。

来自主题: AI资讯

8330 点击 2026-03-19 08:55

ListenHub ASR 语音识别 API 全新上线，无限免费！无限免费！

ListenHub ASR 语音识别 API 全新上线，无限免费。 API 特点：本地离线转录，无需 API Key，安装即可使用。专为 Agent 设计，方便你的 Claude Code 和龙虾🦞直接接入自动化工作流。

来自主题: AI资讯

9543 点击 2026-03-13 19:12

独家｜VUI Labs宇生月伴完成数千万元天使+轮融资，同创伟业领投，打造行业领先的情感语音大模型和多模态Agent

VUI Labs（宇生月伴）宣布完成数千万元天使+轮融资。本轮投资由同创伟业领投、老股东靖亚资本、小苗朗程持续加注，心流资本FlowCapital担任长期财务顾问。公司半年累计获得近亿元投资，所募资金

来自主题: AI资讯

9707 点击 2026-02-28 10:59

憋了4个月，阿里最大最强模型Qwen3-Max-Thinking正式版发布！附一手实测

阿里巴巴推出了Qwen3-Max-Thinking，这是阿里千问系列目前能力最强的旗舰级推理模型，在19项权威基准测试中，Qwen3-Max-Thinking跟GPT-5.2-Thinking、Claude-Opus-4.5和Gemini 3 Pro等顶尖模型打得有来有回，搭配测试时扩展（TTS）能力后，能在不少基准测试上达到SOTA。

来自主题: AI资讯

10472 点击 2026-01-27 11:21

微软发布首个测试时扩展大规模研究，还给出了终极指南

如果说大模型的预训练（Pre-training）是一场拼算力、拼数据的「军备竞赛」，那么测试时扩展（Test-time scaling, TTS）更像是一场在推理阶段进行的「即时战略游戏」。

来自主题: AI技术研报

7789 点击 2025-12-11 11:27