2秒钟转写5分钟音频!国产新语音模型拿下多项SOTA,定价骤减90%
2秒钟转写5分钟音频!国产新语音模型拿下多项SOTA,定价骤减90%阶跃星辰今日发布新一代自动语音识别模型StepAudio 2.5 ASR。该模型面向语音转写与长音频处理场景,在架构上引入Multi-Token Prediction(多Token预测)以提升推理效率,并通过扩展上下文窗口强化长内容识别能力。
搜索
阶跃星辰今日发布新一代自动语音识别模型StepAudio 2.5 ASR。该模型面向语音转写与长音频处理场景,在架构上引入Multi-Token Prediction(多Token预测)以提升推理效率,并通过扩展上下文窗口强化长内容识别能力。
近日,AI医疗企业奥明星程宣布完成超亿元A轮融资,继Pre-A轮之后,该企业在一年内实现融资规模超5倍增长。
今天上午,DeepSeek V4 发布,直接把这个大模型疯狂更新月推向了最高潮。不过在我翻看 V4 的技术报告的时候,在训练层面看到了一个被大部分人滑过去的名词:Muon 优化器。
AI云平台服务提供商涂鸦智能在深圳举办了开发者大会,从AI开发者平台的重磅升级、Hey Tuya、TuyaClaw AI智能体的出色AI交互体验,以及宠物陪伴机器人等AI创新硬件,我们看到涂鸦正全力“All in AI”,全球IoT开发平台也升级为全球AI云开发平台。
4 月 21 日,全球首个,也是迄今为止规模最大的 AI 电影节 WAIFF(2026),在法国戛纳电影宫正式举办。蔚蓝海岸线前,一众影视行业的从业者鱼贯而入,但一改往日红毯众星云集的流光溢彩,这一次的电影节,地毯换成了象征科技的紫色,而走上这条「紫毯」的,也换成了一众 AI 内容的创作者。
ICLR 2026时间检验奖新鲜出炉,获奖者——GPT天才本科生Alec Radford。网友们纷纷送来祝贺:“实至名归!”Alec为人相当低调,其社媒清一水的都是转发推荐他人优秀成果。
昨夜,GPT-5.5果然按期发布了,全网没有白等。更炸裂的是,就在同一天,DeepSeek-V4紧随其后发布了!实测后,结果出人意料。
私募基金真知创投孵化了AI硬件项目——斯塔维科,正式布局AI可穿戴赛道。公开资料显示,北京斯塔维科智能科技有限公司成立于2025年8月,由尹海田担任公司法人。尹海田曾担任小米集团可穿戴技术专家,于去年7月加入斯塔维科,担任合伙人兼CTO。
Cognichip正在构建一个深度学习模型,以便在工程师设计新计算机芯片的过程中为其提供协助。它试图解决的问题是该行业数十年来一直面临的一个难题:芯片设计极其复杂、成本高昂且速度缓慢。先进的芯片从概念设计到大规模生产需要三到五年的时间;仅设计阶段就可能长达两年。想想看,英伟达最新的 GPU 系列Blackwell就包含1040 亿个晶体管——要排列这么多晶体管可不是一件容易的事。
《读佳》获悉,一个名为“豆包帮你选”的功能内嵌在豆包APP导航栏中,此前,豆包被爆料内测购物功能,如今这一功能正式落地,标志着字节跳动旗下AI助手豆包,正式切入电商赛道,一场AI与电商深度融合的布局已悄然拉开帷幕。