AI硬件SpeakON:按下说话松开出字,让手机拥有AI代写能力

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AI硬件SpeakON:按下说话松开出字,让手机拥有AI代写能力
9636点击    2026-04-30 12:15

后键盘时代,SpeakON 们想要抢回被打字偷走的生产力


语音硬件正试图取代键盘,但我们离“开箱即用”还有多远?想象一下,当你走在路上突然想到一段回复,掏出手机打字时灵感却已经跑了一半,而专门的 AI 听写硬件似乎是个好主意。


上周二,一款名为 SpeakON 的AI硬件设备在美国发售,试图用简单的方式解决这个问题。一颗贴在 iPhone 背面的 MagSafe 按钮,按下说话,松开出字。不需要解锁,不需要切换 App。做这件事的人叫张岩(Ryan Zhang)。他曾联合创办摩拜单车,后来创立了 AI 转录平台 Notta,五年间做到全球超 1000 万用户。


从硬件转向 SaaS 时,他说过一句 "Never again"——再也不碰硬件了。但现在,他带着一颗 25 克的按钮回来了。在 Ryan Zhang 看来,听写 App 再多,也绕不开一个问题:软件需要依赖手机麦克风、在前台运行、以及等用户打开它才能工作——而人最需要输入的瞬间,恰恰是腾不出手去操作手机的时候。这个矛盾只有硬件能解。


硬件、SaaS、再回硬件


Ryan Zhang 的职业轨迹似乎有一条清晰的线索——寻找技术与用户之间最短的路径。


06 年毕业后,Ryan Zhang 在优酷、百度、滴滴等公司任职,积累产品和商业化经验。在 2015 年,他参与联合创办了摩拜单车——一家试图用智能锁加移动互联网重新定义城市出行的公司。这些经历能够给他两样东西,对硬件供应链的直觉,和对 "软硬结合" 产品形态的信念。


2018 年,Ryan Zhang 开始独立创业,做的是类似科大讯飞的智能语音硬件,主攻出海。他在线性资本的专访中回忆,那时候产品在美国做众筹,"意外的是在日本卖得很好"。但疫情冲击了硬件供应链和线下销售渠道,于是他 "迅速转型",创办了 AI 会议转录平台 Notta。转向 SaaS 时 Ryan Zhang曾明确说过一句话:"Never again"——不做硬件了。


既然硬件卖不动了,那就把语音 AI 的能力从硬件里抽出来,做成纯软件服务。Notta 支持 Zoom、Google Meet、Microsoft Teams 等主流会议平台的实时转录和翻译。从另一个角度看,这是把 Ryan Zhang 在硬件时期积累的语音处理技术,换了一个交付方式。


但早期非常艰难。"当时也不知道这个事情能不能成功……找投资也并不顺利,投资人并不像今天这样看好出海 SaaS,有一段时间还蛮艰难的。" 转折发生在 2020 年 7 月——日本朝日新闻电视台在没有任何主动宣传的情况下报道了 Notta,流量暴增,团队最初还以为是被黑客攻击了。


此后 Notta 踩中了两个节拍:一是 2021 年推出 Meeting Bot,从 C 端工具切入 B2B 市场;二是 2023 年果断砍掉另一款产品 Airgram,集中资源聚焦 Notta。


"100 万美元营收时团队 30 人,接近千万美元时也不过 60 多人"——他信奉的是 "先小而美" 的增长节奏。截至目前,Notta 全球用户超过 1000万,服务超过 6000 家企业,总部位于新加坡,在东京设有法人实体。为更好的去应对美国市场,Ryan Zhang 还请来了美籍日裔田村清人担任 COO。


后键盘时代,SpeakON 们想要抢回被打字偷走的生产力


然而,2026 年 4 月 21 日,Ryan Zhang 做了一个看似与"Never again"矛盾的决定:让 Notta 旗下品牌 SpeakON 在美国发售一款 MagSafe 语音听写硬件设备。


SpeakON 官网这样写道:"Our CEO built the hardware again. He knew exactly how challenging it would be: selecting the right solution, managing the supply chain, and handling inventory risks... Because this time, it's the only honest answer."


这段话的有个潜台词:不是因为硬件变容易了,主要在于纯软件方案始终绕不开一个问题——手机麦克风的争用、后台常驻的电池消耗、以及每次听写前 "解锁-打开 App-切换键盘" 的操作摩擦。"一天中的大部分时间并非在思考,而是在将想法翻译成文字。这一点点摩擦就足以拖慢所有事情。"


可见,要真正消除这层摩擦,光靠软件不够,需要一颗物理按钮


一颗按钮想解决的问题


SpeakON 被描述为 "World's First Voice Typing Device for iPhone"。不是 "录音设备",不是 "会议助手",它要替代的是键盘。


其设备外形像一颗圆润的鹅卵石,尺寸为 58×58×6 毫米,仅重 25 克——大约相当于 5 枚一元硬币的重量。它通过 MagSafe 磁吸贴合在 iPhone 背面,支持 iPhone 12 及以上机型,设计思路和 Plaud 的 AI 会议记录仪相似,并可在支持文字输入的应用中使用,如 Gmail、Slack、WhatsApp、LinkedIn 等。


后键盘时代,SpeakON 们想要抢回被打字偷走的生产力


价格方面,设备售价 129 美元,购买即附带 Starter Plan(每周 5000 字,Attune 每周 5 次)。不购买设备也可以使用 App,Free Plan 每周 2000 字额度。无限额度的 Pro 订阅月费 12 美元,年付 108 美元(省 25%)。


SpeakON 的使用方式很简单,按下即开始。同时,设备自带独立麦克风收音,可捕获约 60 厘米范围内的声音,且不会占用 iPhone 的麦克风。有使用者称,相比调用听写App,其可在一天内减少约10%~15%的电池消耗。


通过硬件之上的 AI 层,SpeakON 得以做到 "Turn speech into finished text"。这主要体现在以下三个功能:


  • Smart Polish:自动过滤 "嗯" "啊" 等口水话,清理重复,将自然口语整理为可读文本。
  • Smart List:当用户在列举事项时,产品可自动将语音内容格式化为结构化列表——从购物清单到待办事项,不需要用户说 "第一、第二、第三"。
  • Attune:这是 SpeakON 最有亮点的功能。系统会自动检测用户当前所在的 App,并据此调整输出文本的语气和风格。


当用户说 "Tell Sarah the meeting's been moved, I'll send the new invite",如果是在 Gmail 中,输出会变成 "Hi Sarah, just a quick note — our meeting has been rescheduled. I'll send the updated calendar invite shortly" 。用户也可以在 Off、Casual、Professional和 Formal 四种模式之间手动切换


后键盘时代,SpeakON 们想要抢回被打字偷走的生产力


此外,设备还有两个值得注意的功能:一是 iPhone 锁屏状态下使用——按下按钮说话,内容自动保存,之后可在 App 中回顾,灵感来时无需解锁手机;二是即将上线的 Voice Edits 功能,允许用户在说话中途用语音指令引导 AI 重塑输出方向。


然而,我们也观察到一些用户使用过程中遇到的问题。根据 TechCrunch 报道,海外有网友发现,尽管 SpeakON 配有独立麦克风,但手机须保持在约两英尺范围内,否则拾音效果不佳。即使在此范围内,环境噪音也常导致麦克风表现欠佳。


还有一点是其 AI "润色" 时而越界。 Attune 是 SpeakON 极具吸引力的功能,但有时会弄巧成拙。例如,说 "Does this app work automatically?",设备输出 "Does this application operate automatically?";说 "complex",被改成 "tricky";说 "Sure, no worries",变成了 "There is no need to be concerned",这些改动使用者其实既不需要也不想要。


系统限制也构成了阻碍。在使用文本键盘时,用户无法通过双击录音键调起 SpeakON 键盘。"如果设备能在 Mac 上使用并支持在任意应用中听写,我的使用频率会大幅提升",使用者表示。


语音赛道正在变得拥挤


2026 年的听写 App 市场竞争异常激烈。综合 Medium 发布的一篇横评文章, Mac 平台上值得关注的主流选手包括:Wispr Flow(月费 18 美元,以 AI 辅助改写见长)、DictaFlow(月费 7 美元,主打跨平台兼容)、SuperWhisper(强调本地隐私处理),以及苹果自带的系统听写功能。


而就在 SpeakON 发售前约两周,Google 也在 iOS 上线了一款名为"Google AI Edge Eloquent"的离线优先听写 App,基于 Gemma 语音识别模型,免费使用,支持本地处理。


对投资者来说,这个信号的含义是双重的。纯软件订阅路线的独立生存空间正在收窄。但巨头的入场,也确认了这条赛道本身是真实且值得争夺的 软件端的竞争越白热化,反而越能抬升"软硬结合"方案相对的护城河


 SpeakON 并非唯一一家押注"语音硬件"的公司。市场上已有多条产品线形成了差异化竞争格局:


  • Plaud Note Pro:目前 AI 录音硬件领域的标杆产品。配备 4 颗 MEMS 麦克风+VPU,支持百种语言转录。PCMag 曾称前代产品 Plaud Note 为"我用过的最好的AI硬件产品"。


后键盘时代,SpeakON 们想要抢回被打字偷走的生产力


  • Subtle Voice Buds:语音 AI 初创公司 Subtle 在 CES 2026上发布的降噪耳机,主打在嘈杂环境中实现清晰的语音听写。这款产品将听写功能内嵌到耳机形态中,代表了另一种硬件思路。


  • 安克 AI 录音豆:飞书 × 安克创新联合发布,双全向麦克风、5 米收音、8 小时续航,底层大模型由豆包驱动,录音内容自动同步飞书生态。


不过,它们与 SpeakON 所瞄准的实时听写输入还是大有不同。SpeakON 的使用场景相对来说更高频、日常。使用频次上的差异,意味着潜在粘性也完全不同


大趋势清晰可见,语音正在成为新的交互界面。 从纯软件 App 到专用硬件,从单一转录到 AI 意图理解,从逐字记录到智能润色——整个行业正在沿着"更自然、更低摩擦、更情境化"的方向演进。


斯坦福、华盛顿等高校联合发表的一项研究表明,在移动设备上,英语语音输入速度约为键盘打字速度的 3 倍(161 WPM vs 53 WPM),中文约为 2.8 倍。


后键盘时代,SpeakON 们想要抢回被打字偷走的生产力


当 AI 语音模型精度持续提升,语音输入正从"备选方案"升级为许多专业人士的"首选工具"。Subtle CEO Tyler Chen 观察到,"我们看到语音作为新交互界面正在被大量用户采纳。相比键盘,语音能以更自然的方式完成更多事情。"


SpeakON 的定位恰好卡在一个独特的缝隙中。 SpeakON 将硬件按钮、AI 听写键盘、语境自适应整合在一起。它不仅能录下会议内容供事后回顾,而且能在当下就把你的想法变成可以直接发送的文字。


这个定位具有真实的市场需求,但目前的执行力还撑不起这份野心。在供应链高度成熟的今天,任何竞争对手都可以用类似的元器件迅速推出替代品,蚕食这个刚刚萌芽的市场。


不过硬件代差不是方向错误,是可以被迭代填平的执行差距——迭代需要时间,这条赛道的竞争者不会停止升级。“实时语音输入替代键盘”正在发生,SpeakON 们展示了一个值得持续关注的产品方向。


参考来源:


专访Notta创始人张岩:AI SaaS产品在日本的本地化策略.明论 Dialogue.


Best Mac dictation apps in 2026: DictaFlow, Wispr Flow, SuperWhisper, and Apple Dictation compared. Medium.


SpeakON's dictation device is a good idea marred by platform limitations. TechCrunch.


文章来自于微信公众号 "有新Newin",作者 "有新Newin"

关键词: AI新闻 , SpeakON , AI语音 , AI硬件 , Notta
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales