AI硬件SpeakON:按下说话松开出字,让手机拥有AI代写能力
AI硬件SpeakON:按下说话松开出字,让手机拥有AI代写能力上周二,一款名为 SpeakON 的AI硬件设备在美国发售,试图用简单的方式解决这个问题。一颗贴在 iPhone 背面的 MagSafe 按钮,按下说话,松开出字。不需要解锁,不需要切换 App。做这件事的人叫张岩(Ryan Zhang)。他曾联合创办摩拜单车,后来创立了 AI 转录平台 Notta,五年间做到全球超 1000 万用户。
搜索
上周二,一款名为 SpeakON 的AI硬件设备在美国发售,试图用简单的方式解决这个问题。一颗贴在 iPhone 背面的 MagSafe 按钮,按下说话,松开出字。不需要解锁,不需要切换 App。做这件事的人叫张岩(Ryan Zhang)。他曾联合创办摩拜单车,后来创立了 AI 转录平台 Notta,五年间做到全球超 1000 万用户。
4 月 20 日之后,想要给 Claude 花钱的人有难了:想花钱却下不去手。新的 Claude Pro 套餐付费用户,可能不包含 Claude 最强势的编程功能,Code 将会被「抬」进到 Max 5x 套餐,也就是每月 100 刀的订阅费用。
今天,大洋彼岸,硅谷自动驾驶领域的秘密,终于有大佬站出来分享了。如果你对自动驾驶、人形机器人中炙手可热的 VLA、世界模型还有疑惑,全球“物理 AI” 领域头部的基础设施平台 Applied Intuition 两位创始人:CEOQasar Younis、CTO Peter Ludwig的分享可真的是太对口了。
今天没选题了,所以想开源一个我自己做的,已经用了快1个多月,迭代了好多版的一个我觉得很有用的Skill。我把它称为,洁癖.Skill。名字可能听着还挺呆逼的,但是我觉得它能干的事,虽然看着非常的简单,但是却又很实用,在公司内部同事和一些我们的合作伙伴使用后,还都反馈挺不错的。
来自华为泰勒实验室、北京大学和上海财经大学的研究团队提出了 SHAPE(Stage-aware Hierarchical Advantage via Potential Estimation),给推理链装上了一套「里程碑 + 推理税」机制——不仅告诉模型每一步推得对不对,还让它为啰嗦付出代价。结果是:准确率平均提升 3%,token 消耗直降 30%。
Petoi Bittle 是一款开源、可编程、四足仿生AI机器狗,尺寸为20cm×11cm×11cm,只有手掌大小,重量不到280g,它的肚子下可以携带450g的「货物」。Bittle 机器狗有12个舵机,组合60多套动作,可跑可跳,还可以爬上纸箱子,能在实时指令下表演更多的花样。如果摔倒了,它会自己爬起来。就连在下雨天想走,沙地上也都完全没问题。
《读佳》独家获知,百度智能云团队做了一款AI短剧创作平台Hogee AI,并会推出APP版本。据了解,Hogee为AI短剧全链路创作平台,依托百度自研的OpenClaw数字员工体系,用不同工种的AI智能体替代传统短剧团队中的部分岗位,让创作者依托大模型实现从剧本到成片的落地,有利于优质故事以低成本走向市场。
Doc-V* 由小米大模型 Plus 团队和华中科技大学 VLRLab 团队合作提出,一种从「静态阅读」到「主动探索」的多页文档理解新范式,通过交互式视觉推理让模型像人一样有策略地阅读长文档。
搭了个agent,结果该被记住的历史交互经验一点没记住,不该被记住的工具调用结果、过程输出被一股脑塞进上下文,导致输出质量下滑,类似的上下文失焦问题,这是多少人做agent时候的噩梦?
伦敦大学学院(UCL)、普林斯顿大学和爱丁堡大学的研究团队联合推出了Avenir-Web,让现有多模态模型像人类一样使用网页。现有的Web Agent在面对复杂的网页结构(如 iframe、Shadow DOM)时,往往会陷入“定位不准”“缺乏常识”或“走着走着就忘了”的窘境。