ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
大模型引爆AI音频眼镜,科技巨头跑步入场
6827点击    2024-08-12 17:32

8 月 8 日,罗永浩发布了一篇五千字长文,一一反驳此前传出「罗永浩五宗罪」,再一次讽刺了一把「铁老师」(俞敏洪)。不过这显然不是数码爱好者关心的话题,就像有些网友指出的:


老罗的细红线呢?


作为一家罗永浩旗下的 AR 初创公司,细红线至今没有推出一款产品,年初还曝出放缓了 AR 业务软硬件研发。不过按照罗永浩此前在直播中透露的信息,细红线将于 9 月正式推出两款新品,分别定价


199 美元(约合人民币 1426 元)和 299 美元(约合人民币 2144 元)。


其中 199 美元定价的新品,不太可能对标目前主流的轻量化 AR 眼镜,所以行业普遍猜测,这是一款 AI 音频眼镜,就像 Ray-Ban(雷朋)Meta 智能眼镜。


不只是细红线。


同样在昨天,小米生态链公司蜂巢科技发布自主品牌「界环」以及第一代 AI 音频眼镜,这也是该公司的第三代产品。在此之前,蜂巢科技已经为小米推出过米家眼镜相机、米家智能音频眼镜。



相比之前的米家智能音频眼镜,界环 AI 音频眼镜,最核心的一个变化就是像 Ray-Ban Meta 智能眼镜一样:


接入了大模型。


不经意间,又一个风潮可能已经到来。


01 799 元的国产 Ray-Ban Meta?


在目前这个阶段,说 AI 音频眼镜,绕不开 Ray-Ban Meta。


尽管与前代产品 Ray-Ban Stories 一样,Ray-Ban Meta 继续采用了雷朋的经典时尚眼镜造型,但带来了声音和影像方面的重大升级,并引入 Meta AI(基于 Meta 自己的 Llama 大模型)。


去年秋天,Me­ta 与雷朋正式联名推出了 Ray-Ban Meta,很快就出货了 30 万副,并在发售 4 个月后实现了超 100 万台的销量成绩。要知道,根据 IDC 的数据,2023 年全年 AR 眼镜销量仅 48 万副,


智能眼镜也不过 101 万副,其中还有包括 Ray-Ban Meta 的数十万副。


Ray-Ban Meta 的成功,不仅超出了 Meta 和依视路陆逊梯卡(雷朋眼镜母公司)的预期,也引起无数人和公司的注目。前段时间,甚至传出谷歌正在计划购买依视路陆逊梯卡的部分股份,以便推出搭


载 Gemini AI 的 Ray-Ban 智能眼镜。


国内厂商当然也关注到了,并纷纷成立或者加快推进 AI 音频眼镜项目,其中就包括蜂巢科技。


8 月 8 日,蜂巢科技正式发布了界环 AI 音频眼镜,提供 8 种镜框和 14 种颜色可选,重量为 30.9g,支持音乐播放可达 11 个小时。价格方面,界环 AI 音频眼镜定价 799 元起,首发优惠价为 699 元


起。


硬件部分,界环 AI 音频眼镜走的也是「日常路线」,尽可能地维持了常规眼镜的外观设计,但镜腿不可避免厚得有些怪,其中集成了音频模块、电池以及 AI 模块。


和所有音频眼镜一样,界环 AI 音频眼镜基于开放声场设计,拥有 109mm² 振膜,振幅 0.5mm,支持定向声波传输;配备逆声场结构和防漏音膜,支持双重防漏音;同时搭载双麦克风降噪,支持通话降


噪。


与此相对的,Ray-Ban Meta 采用的是雷朋最经典的时尚眼镜设计,镜腿设计原本就比较宽、比较厚,所以加入各种组件后不会显得太过突兀。


另外不同的是,界环 AI 音频眼镜没有加入摄像头,而这是 Ray-Ban Meta 最主打的产品卖点之一,可以支持第一视角的视频通话、Meta 平台的视频直播以及 AI 图像识别。


不过,界环 AI 音频眼镜还是接入了大模型。根据介绍,界环 AI 音频眼镜目前接入了 14 个大模型(包括通义、百川等),共搭载三项 AI 应用,包括 AI 畅聊、AI 通知播报、面对面翻译。


「AI 畅聊」和「面对面翻译」都不言自明,唯一要指出的是,「AI 通知播报」是 AI 对所有通知进行理解,然后总结播报,设计目的是提升消息通知的效率。



另外需要指出,大模型的调用成本虽然经过了几轮大规模地降低,但终究还是不低。作为初创公司,界环 AI 音频眼镜给出的方案是今年年底前购买产品的用户将永久免费使用 AI 功能,向此后购买的用


户收取 19.9 元/月(或随 API 价格调整)。


这里也简单总结下,界环 AI 音频眼镜的应用场景其实非常单一,甚至比起 Ray-Ban Meta 还要简单,基本就是在传统眼镜的基础上加上了「一副开放式耳机」以及「一些 AI 功能」。


如果冲着 AI,至少目前我并不建议购买,太过鸡肋。但如果你想要一款日常佩戴的音频眼镜,799 元起的界环 AI 音频眼镜,值得关注。


02 科技公司涌向 AI 音频眼镜


界环 AI 音频眼镜的推出,只是 AI 音频眼镜这个赛道的一角。


今年 4 月,AR 初创公司李未可科技推出了旗下首款 AI 眼镜——Meta Lens Chat,定价 699 元,核心是砍掉了 AR 显示模块,主打 AI 语音交互(基于自主训练的 WAKE-AI 大模型),号称能在 500ms


内精准识别用户指令,调用云端大模型回答也只需 2 秒左右。



5 月举办的华为夏季全场景新品发布会上,较早进入音频眼镜赛道的华为,也推出了新款智能眼镜——华为智能眼镜 2 方框太阳镜,售价 2299 元。该产品最核心的亮点是接入了华为盘古大模型,支持


智慧播报(与界环「AI 通知播报」类似),续航也能做到长达 11 个小时的连续音乐播放。



还有更多厂商正在准备推出类似的产品。


4 月,就有媒体曝出字节跳动收购开放式耳机品牌 Oladance,其中一个重要的目标就是推出类似 Ray-Ban Meta 的 AI 音频眼镜产品。而从定价来看,罗永浩口中 199 美元的新品,大概率也是砍掉 AR


显示模块的 AI 音频眼镜。


讽刺的是,不提供AR能力是 AI 音频眼镜成为新宠的重要原因。


众所周知,光学显示模组一直是 AR 眼镜面对的核心技术挑战,也是最大的硬件成本之一。砍掉光学显示模组,直接意味着成本和价格的降低,电池续航的提升,同时也能设计得更轻薄,以改善佩戴体


验。


尽管各家轻量化 AR 眼镜都在强调时尚眼镜的外观设计,但实际上受制于光学显示模组,轻量化 AR 眼镜在佩戴上不同于传统眼镜,外人来看还是有些怪异。而不管是 Ray-Ban Meta,还是华为之前推


出的智能眼镜,在外观设计上都是人们更乐于接受的传统眼镜造型。


但仅是如此肯定不够,否则 Ray-Ban Stories 或者华为智能眼镜早就火了。核心,还是要回到 Ray-Ban Meta 通过软硬整合在音频、影像以及 AI 上的升级。


对于国产厂商,硬件上的问题不大,但关键可能是软件和场景。受益于 Meta 作为社交巨头,Ray-Ban Meta 的视频直播和视频通话功能,完全可以利用上更好的摄像头和拍摄质量。事实上,这也是吸


引不少人购买的核心卖点。



与之相对,国产厂商如果没有对接微信、抖音等平台,就算加入摄像头也是无用武之地,甚至徒增成本和重量。毕竟,真正需要通过眼镜而非手机来拍摄的场景,其实不多。


至于 AI 的引入,毫无疑问是 Ray-Ban Meta 故事中最性感的「部分」。


ZDNET 编辑就评价称,「Meta AI,眼镜的内置聊天机器人,真正让这些智能可穿戴设备变得智能,但仍有改进的空间。」还有众多购买者,就是被 Meta AI 激起了兴趣。也是为了 AI,Ray-Ban Meta


甚至塞下了骁龙 AR1 Gen 1 和端侧小模型,不惜牺牲一定的重量和续航。


但必须要说,现阶段 AI 最大的使用价值可能还是强大的语义理解能力,其他更多是给设备体验带来更大的「改进空间」和「想象空间」,或者换句话说:未来可期。


03 写在最后


当所谓「AI 新物种」AI Pin 和 Rabbit R1 的泡沫破灭之后,很多人都对「AI+」开始祛魅。同样,不要过高地预期 AI 音频眼镜上「AI」的体验,将其视为音频眼镜的「增值功能」,或许更能帮助你直


观地评估其购买价值。


本文来自微信公众号“雷科技”,作者:雷科技




关键词: AI , AI音频 , AI音频眼镜 , AI硬件
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales