击败GPT、Gemini,复旦×创智孵化创业团队「模思智能」,语音模型上新了
击败GPT、Gemini,复旦×创智孵化创业团队「模思智能」,语音模型上新了近日,由复旦邱锡鹏担任首席科学家的模思智能发布了多说话人自动语音识别(ASR)模型 MOSS-Transcribe-Diarize,不但可以语音转文字,还可以将音频片段与对话中不同的说话者关联起来,性能超过了 GPT-4o、Gemini、豆包等一众模型。
近日,由复旦邱锡鹏担任首席科学家的模思智能发布了多说话人自动语音识别(ASR)模型 MOSS-Transcribe-Diarize,不但可以语音转文字,还可以将音频片段与对话中不同的说话者关联起来,性能超过了 GPT-4o、Gemini、豆包等一众模型。
这不是一个普通的Skill,而是一把“把经验变成Skill”的工具:Claudeception是一个Meta-Skill,即专门用来“生产技能”的技能。
我最近在刷 TikTok 和 YouTube 的时候,发现一件挺有意思的事。
10B参数拥有媲美千亿级模型的多模态推理实力。
智谱AI上市后,再发新成果。
数据库技术初创公司ClickHouse 在新一轮融资中筹集了 4 亿美元,公司估值达到 150 亿美元——比不到一年前的估值翻了一番以上。这笔大规模融资传递出投资者对人工智能应用支撑型企业的青睐信号,这类企业正与Databricks 和 Snowflake 等公司展开竞争。
在2026年的世界经济论坛上,微软 CEO 萨提亚·纳德拉(Satya Nadella)与贝莱德 CEO 拉里·芬克(Larry Fink)进行了一场对话。
前两天听同事说豆包在浦东美术馆接活儿了,不光带人逛展,还包讲解的那种。(震惊.jpg)
交互、计算解耦后,穿戴设备只需要做纯交互终端就够了,手机理论上可以做得更薄,iPhone Air可以看作是在做这种准备;
不讲武德!游戏圈这回真是被AI抄家了。(doge)