2499,AI浓度爆表!戴上这副眼镜,一句话点咖啡/实时翻译/AR导航全搞定

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
AITNT-国内领先的一站式人工智能新闻资讯网站 搜索
2499,AI浓度爆表!戴上这副眼镜,一句话点咖啡/实时翻译/AR导航全搞定
5772点击    2024-11-20 09:39

AI眼镜热潮,迎来了XR实力派的降维打击。


这款最新AR眼镜,有AR的深厚技术积累,也加持了最新的AI大模型能力,还跟时尚最时尚的眼镜厂商联手。


2499,AI浓度爆表!戴上这副眼镜,一句话点咖啡/实时翻译/AR导航全搞定


能干什么?


一副眼镜可以等于一个真人翻译


戴上它,再也不用紧张工作会议中没听清歪果客户说啥。AR眼镜直接将听到的语音实时翻译成中文、并呈现在眼前。


2499,AI浓度爆表!戴上这副眼镜,一句话点咖啡/实时翻译/AR导航全搞定


赶着上班打卡来不及用手机买咖啡?


没关系,只需说一句“帮我点杯拿铁”,AR眼镜就能根据你日常习惯下单,并且支持声纹识别支付,完全无需手动操作。


2499,AI浓度爆表!戴上这副眼镜,一句话点咖啡/实时翻译/AR导航全搞定


导航也不再需要一直低头看手机了。戴上这副眼镜,它就能成为实时定位,用语音为你指路。


2499,AI浓度爆表!戴上这副眼镜,一句话点咖啡/实时翻译/AR导航全搞定


当然,它也能成为抓拍最及时的相机


点一点镜腿,萌娃的可爱瞬间立马被记录,这可比掏手机、相机快太多。


2499,AI浓度爆表!戴上这副眼镜,一句话点咖啡/实时翻译/AR导航全搞定


这就是最新发布的AR眼镜——Rokid Glasses


它的外形时尚轻便,几乎和普通眼镜无异,BOLON眼镜操刀外观设计。


功能上,不仅和普通AR眼镜一样具备显示能力,也集成了多模态AI能力。


必须要承认,今年智能眼镜真的火啊,不少厂商都开始布局,甚至是跨界入局。


但如果智能眼镜——公认的手机之后的下一代交互终端,就是AI+眼镜,给眼镜加个摄像头然后接大模型,那Google Glasses当年是不是太冤了?


所以现在,AR实力派玩家Rokid,用最新产品给出了回应。


2499,AI浓度爆表!戴上这副眼镜,一句话点咖啡/实时翻译/AR导航全搞定


把AI打碎到日常生活


从功能体验上来看,Rokid Glasses颠覆了诸多日常场景,从出行到办公、从演讲到学习……


它兼具AR眼镜、耳机、AI助手和相机的多方面能力。


最先被变革的就是拍照和摄像的体验了。


现在,只需点点镜腿,就能记录美好瞬间,支持长视频拍摄,还能一键分享朋友圈。


2499,AI浓度爆表!戴上这副眼镜,一句话点咖啡/实时翻译/AR导航全搞定


也兼顾耳机的能力,可以听歌、接电话等。


AI方面具备AI问答、AI搜索、AI识别、AI多语言翻译、AI实时导航、AI快速回复、AI闪记、AI转译等能力


只需唤醒“乐奇”,就能让它帮你搞定各种操作。而且响应速度非常快,语音等文本指令,在1秒内反馈完成,图像等多模态信息2秒内反馈完成。


由此,在开会时,可以让它来记录当下碰撞出的灵感火花。


2499,AI浓度爆表!戴上这副眼镜,一句话点咖啡/实时翻译/AR导航全搞定


或者是让AI快速回复消息,避免重要信息被遗漏。Rokid Glasses接入钉钉等软件,可以实时接收信息。


同时它也能充当实时翻译。通过麦克风拾取对话内容,乐奇就能进行翻译,并将中卫直接打在虚拟屏幕上。


这样一来,避免了人工翻译打断发言者的情况,能让双方的对话体验更流畅。


2499,AI浓度爆表!戴上这副眼镜,一句话点咖啡/实时翻译/AR导航全搞定


做演讲时,Rokid Glasses可以成为眼前的提词器。Rokid创始人&CEO Misa今天的现场发布,就是把题词放到了眼镜中。


2499,AI浓度爆表!戴上这副眼镜,一句话点咖啡/实时翻译/AR导航全搞定


外出骑行时,只需一句话即可开启AI实时导航,并将导航信息显示在虚拟屏幕上,实时规划路线。


2499,AI浓度爆表!戴上这副眼镜,一句话点咖啡/实时翻译/AR导航全搞定


做饭时,也能直接询问乐奇,“番茄牛腩怎么做?”它就能进行AI搜索,并将搜索结果显示在眼前。


它甚至还能解答数学题,只需咔嚓拍照,乐奇就能识别题目进行解答。Misa在发布中表示,它能解答线性方程、微积分等高阶难题。


2499,AI浓度爆表!戴上这副眼镜,一句话点咖啡/实时翻译/AR导航全搞定


除此之外,Rokid Glasses还具备AI转译、AI健康提醒等能力。


2499,AI浓度爆表!戴上这副眼镜,一句话点咖啡/实时翻译/AR导航全搞定


由于接入支小宝,用Rokid Glasses打车也只是一句话的事儿。


无论你是正在办公室/家里准备外出,还是在户外,都更专注于自己手头上的事,把打车这类小事交给眼镜。


支小宝可通过声纹识别支付,使用Rokid眼镜支付过程中,可与手机保持可信连接,并通过支付宝账户对支付做安全保障。


同时Rokid Glasses还具备物体识别能力。如果戴去博物馆,它就能识别你看到的文物/艺术品,展开介绍它的背景和故事。


2499,AI浓度爆表!戴上这副眼镜,一句话点咖啡/实时翻译/AR导航全搞定


在产品方面,首先在外观上,Rokid Glasses几乎和日常佩戴的眼镜无异,BOLON眼镜操刀的大框设计更显时尚。


2499,AI浓度爆表!戴上这副眼镜,一句话点咖啡/实时翻译/AR导航全搞定


眼镜采用一体化设计,整体重量仅49g,非常贴近于普通眼镜(大约30g),而且包含显示功能。而不包含显示能力的Ray-Ban Meta,官网标出的重量为49.2g。


同时也支持近视/散光人群镜片定制,卡扣安装即可,拆装非常方便。


2499,AI浓度爆表!戴上这副眼镜,一句话点咖啡/实时翻译/AR导航全搞定


但就在这副纤薄的框架中,被塞进了主板、电池等核心组件。


显示上,采用了行业领先的衍射光波导成像技术。


扬声器采用双声道高保真定向配置,保障音质同时减少声音外泄,更好保护隐私。


Rokid Glasses配备一颗1200万像素专业级摄像头,达到业内领先水平,支持竖屏模式下高清拍照和视频录制。


同时还设置了拍摄状态指示灯,在摄像头开启时,指示灯就会亮起提示。


2499,AI浓度爆表!戴上这副眼镜,一句话点咖啡/实时翻译/AR导航全搞定


其次底层硬件上,Rokid Glasses搭载先进的高通AR 1旗舰处理器,2GB RAM+32GB ROM存储。


AR 1不仅能为AR眼镜提供更好的拍摄、识别能力,也能充分调用AI能力增强图片视频拍摄质量等。


此外还搭配健康和运动传感器,支持用户通过点头摇头等动作触发指令。


2499,AI浓度爆表!戴上这副眼镜,一句话点咖啡/实时翻译/AR导航全搞定


Rokid Glasses支持蓝牙标准5.3,可以连接智能手机、平板等设备。


10分钟即可充电90%,20分钟完成满充。


同步推出了一个可充电的眼镜盒,眼镜盒满电情况下可完成10次满充。


2499,AI浓度爆表!戴上这副眼镜,一句话点咖啡/实时翻译/AR导航全搞定


最后在AI方面,Rokid Glasses选择整合业界领先的阿里通义千问大模型,支持完成各种多模态任务。


通义千问支持视频、图像、文字和语音等模态信息输入。通过快速识别摄像头捕捉到的物体或场景,通义千问就能进行分析判断,并通过语音或视觉反馈为用户提供相关信息。


2499,AI浓度爆表!戴上这副眼镜,一句话点咖啡/实时翻译/AR导航全搞定


由此,Rokid Glasses能进行物体识别、文字翻译、数学题解答等。


总结来看,Rokid Glasses将AR和AI做了更深入的融合,并希望离普通大众更近一步。


在外观上,得益于BOLON眼镜操刀设计,Rokid Glasses更符合大众审美。不仅是数码产品,更有望成为一款出街时尚单品。


一体化、轻便的机身也更利于全天候佩戴。同时,语音&触控操作都非常简单,用户可以直接上手学习。


价格上也相当友好,配备显示能力的Rokid Glasses,只需2499元。


2499,AI浓度爆表!戴上这副眼镜,一句话点咖啡/实时翻译/AR导航全搞定


为了保障智能化水平,Rokid Glasses和阿里合作,集成业内领先的通义千问大模型。


当然也要保障AR眼镜本身的全面能力,因此Rokid Glasses支持大量常用应用,并尝试把今年兴起的AI应用(如支小宝)也纳入生态。


由此,Rokid Glasses为AI+AR提供了一个值得参考的行业范式。


但为啥AI趋势正酣时,AI+AR的成熟范式就能被快速推出?


这得益于AR眼镜自身的发展成熟,也得益于AR和AI天生的适配性。


AI+AR正在更明确


今年,Meta Ray-Ban直接引爆AI眼镜、乃至AI硬件市场。


不同于AI Pin、 Rabbit R1的短暂火爆,Meta Ray-Ban有着实打实的成绩——发售后两个季度卖出100万副。


这意味着,在AI硬件这个赛道里,眼镜成为更被认可的形态


紧接着,Meta发布了首款AR眼镜Orion,它就是在AR的基础上进一步展现AI能力。不过这不是一款面向普通消费者的产品。而另一边,OpenAI最近也收编了Meta原AR产品负责人,有意向布局AR领域。


这些动向并非巧合,而是AI和AR天生适配的进一步外化体现。


原因还要从AR领域自身的发展看起。以已经成立10年的Rokid为例——


在2014年成立时,Rokid定位人机交互,最先在北京和硅谷成立两个实验室,A Lab 和 R Lab。A Lab 是AI,R Lab 是Reality,加在一起就是AR,也是下一代人机交互的方向


2499,AI浓度爆表!戴上这副眼镜,一句话点咖啡/实时翻译/AR导航全搞定


如今的Rokid以AR深入人心,但是最早发力的方向其实在AI。在深度学习浪潮席卷全球时,Rokid推出了AI音箱、开源AI交互系统。


这也一度导致Rokid被视作是一家AI公司。不过Rokid CEO祝铭明一再表示,Rokid是一家人机交互公司,只不过生逢AI技术,可以利用AI来实现更高效智能的人机交互,并能通过产品来验证技术。


这种理念很快在2016年进一步显现。


这一年,Rokid组建AI视觉团队,低调进军AR。2年后,旗下首款AR眼镜问世,Rokid在AR的布局开始清晰明了,并以每年2款产品的发布节奏,持续扩大自身布局。


2499,AI浓度爆表!戴上这副眼镜,一句话点咖啡/实时翻译/AR导航全搞定


在这之中,Rokid的AI浓度要比传统AR厂商更高。


比如团队花费4年时间带来的单目摄像方案。它实现了在AR眼镜上,只用1颗摄像头去做整个空间识别和3D手势。


要知道,只用一颗摄像头是难以感知空间深度信息的。Rokid通过AI生成深度信息,使得空间计算中,70-80%信息由AI合成。


带来的好处就是,单目方案可以进一步减轻眼镜自重、降低功耗,同时也能让设计更为简洁。


这使得Rokid能进一步追求AR眼镜的终极形态——一体式方案


同时,为了保障AR独立行走,Rokid还率先推出AR主机,能让AR眼镜与手机做切割,建立更原生AR的内容生态。


从2016至今,Rokid已经发布10余款AR产品。


最新发布的Rokid Glasses正是当下AR+AI趋势下,Rokid呈现的最好答案


2499,AI浓度爆表!戴上这副眼镜,一句话点咖啡/实时翻译/AR导航全搞定


它为如今AI应用爆发提供了新型平台,也为AR进一步智能化给出参考。


随着大模型落地趋势到来,AI应用爆发。


在移动终端上,AI应用的一个重要发展方向便是节省繁琐操作。让用户能够通过自然语言交互,完成过去复杂的屏幕操作。


2499,AI浓度爆表!戴上这副眼镜,一句话点咖啡/实时翻译/AR导航全搞定


对于人类而言,最自然的语言交互就是说话。说一句“帮我点杯咖啡”,比自己找APP、选品牌产品、下单支付要方便得多。


但在手机上实现这些操作,还是需要用户拿出手机、唤醒AI,会打断他本来的动作和行为。


相对而言,眼镜就是更适合的载体。它佩戴在头上,能够让用户在做其他事时,通过语音进行交互。这种天生的沉浸式和便携性,让AR眼镜更适合碎片化AI场景。


2499,AI浓度爆表!戴上这副眼镜,一句话点咖啡/实时翻译/AR导航全搞定


从AR领域来看,经过十余年发展,AR眼镜自身已经相对成熟。


从底层芯片、轻薄设计、显示成像以及系统开发、应用生态等,AR眼镜的软硬件都为引入AI能力打下了基础。


这使得在当下将大模型放入AR眼镜,在工程上是可行的。


Rokid Glasses就是最好的例子之一。


2499,AI浓度爆表!戴上这副眼镜,一句话点咖啡/实时翻译/AR导航全搞定


由此,在2024年,Rokid早早喊出的那句“AI和AR其实是一回事”,终于得到了验证。


而且,对于这种趋势的认可,不仅体现在AR、AI领域本身。各类应用生态伙伴也在以实际行动,推动AI+AR的快速前进。


阿里爱奇艺B站都来牵手合作


在Rokid最新发布上,钉钉、爱奇艺、淘宝、哔哩哔哩也官宣了一系列新合作。


2499,AI浓度爆表!戴上这副眼镜,一句话点咖啡/实时翻译/AR导航全搞定


在办公场景下,Rokid携手钉钉探索未来AR办公的新模式。基于YodaOS-Master平台开发的钉钉AR版本支持多屏幕联动及单应用多开等功能,可以进一步提升用户的工作效率。


娱乐场景下,爱奇艺透露正在构建一个覆盖多种设备和全场景的AR生态系统,将包括空间多屏显示、空间交互以及云台模式等新功能。并选择与Rokid进行合作探索,重塑AR娱乐格局。


购物场景下,Rokid和淘宝合作将AR引入在线购物,推出3D商品展示和虚拟样板间功能,消费者能获得更沉浸的购物体验。


教育方面和与网易有道合作,利用AR技术提供虚拟英语教师互动交流,增强学习趣味性和口语表达能力。


Rokid还与哔哩哔哩合作,为《时光代理人》IP注入AR游戏元素,使用户能够与虚拟角色互动,并在现实世界中再现动画场景。


此外,Rokid与智象未来合作,在AR设备上实现了AI生成三维内容,简化创作流程,提高生产效率与作品质量。


2499,AI浓度爆表!戴上这副眼镜,一句话点咖啡/实时翻译/AR导航全搞定


为啥大家都选择Rokid?


来看Rokid成立10年的成绩单——


截至目前,Rokid推出了AR Studio、AR Lite等多款产品,购买人数超过30万,且日常活跃度达到75%以上,用户日使用时长达到2h45m+


ToB方面,Rokid在文博市场占有率达到99%,用户数量突破250万。


2499,AI浓度爆表!戴上这副眼镜,一句话点咖啡/实时翻译/AR导航全搞定


在产品形态上,Rokid率先在行业内提出分体式设计。通过将电池、芯片、主板等核心部件从眼镜中分离到Station上,能在提高佩戴舒适度同时保障AR眼镜性能,为AR独立行走开辟道路。


在技术方案上,Rokid坚持单目摄像头识别方案。相较于行业中更为广泛的双目方案,单目方案可以让AR眼镜重量更低、结构更简单、功耗更低,并且能避免双目方案眼镜容易轻微变形、进而导致摄像头参数不准的问题。


2499,AI浓度爆表!戴上这副眼镜,一句话点咖啡/实时翻译/AR导航全搞定


此外,在光学方案上Rokid正在探索更面向未来的光波导路线。它能将光线沿着一个非常薄且透明的平板材料传导,将微型显示屏上的图像传递到用户眼中。


这种方案有着非常高的光线透过率(通常在80%以上),结构更紧凑轻便,能实现真正意义上的双眼显示,适合更加轻量化的AR眼镜。


2499,AI浓度爆表!戴上这副眼镜,一句话点咖啡/实时翻译/AR导航全搞定


另外值得一提的是,生态方面,Rokid推出了YodaOS-Master平台、灵境等供海内外开发者和创作者使用,构建了国内最大的AR开发者社区,聚集了90%专业AR开发者。其中注册开发者超过6200,企业开发者超过2500.


就在本次发布上,Rokid还推出了Station2创作版,在原有基础上增加2枚摄像头,支持空间拍照,为开发者提供拍摄功能。


2499,AI浓度爆表!戴上这副眼镜,一句话点咖啡/实时翻译/AR导航全搞定


并发布了Rokid Spatial Link,只需一根线连接电脑、手机、iPad、Xbox、PS5等支持DP协议的设备,就能立即开启空间显示体验。


2499,AI浓度爆表!戴上这副眼镜,一句话点咖啡/实时翻译/AR导航全搞定


总之,从产品、技术、生态方方面面,Rokid都早已走在了行业前列。


如今,AR+AI的方向更加明确。一时之间,各路人马都涌进这一赛道,行业内外好不热闹。


Rokid Glasses为行业提供了一种参考范式——XR厂商+时尚墨镜品牌+一流大模型,让更AI的AR眼镜,从一开始就兼顾硬件体验、好看外观和智能化体验。


2499,AI浓度爆表!戴上这副眼镜,一句话点咖啡/实时翻译/AR导航全搞定


AI大模型在多模态交互能力上的突破,之前给了业内这样的错觉——给眼镜加个摄像头,再集成AI能力就是下一代智能交互终端。


但Rokid也好,更早之前Meta也好,甚至苹果Vision Pro给出的方向押注也好,证明了AI对于下一代智能终端的如虎添翼,终究要建立在XR技术积累之上,或者可以更肯定的说——AR显示和交互技术基础之上。


对于智能眼镜,AI不会是谁的壁垒,AR显示和交互能力才是,丰富活跃的生态才是。


从Rokid Glasses,这一切才只是刚刚开始。


你说呢?


2499,AI浓度爆表!戴上这副眼镜,一句话点咖啡/实时翻译/AR导航全搞定


文章来自于“量子位”,作者“而小明”。


2499,AI浓度爆表!戴上这副眼镜,一句话点咖啡/实时翻译/AR导航全搞定

关键词: AI , AI眼镜 , AI硬件 , Rokid Glasses
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/

2
逆向大模型

【开源免费】kimi-free-api是一个提供长文本大模型逆向API的开渔免费技术。它支持高速流式输出、智能体对话、联网搜索、长文档解读、图像OCR、多轮对话,零配置部署,多路token支持,自动清理会话痕迹等原大模型支持的相关功能。

项目地址:https://github.com/LLM-Red-Team/kimi-free-api?tab=readme-ov-file