ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
2499,AI浓度爆表!戴上这副眼镜,一句话点咖啡/实时翻译/AR导航全搞定
5464点击    2024-11-20 09:39

AI眼镜热潮,迎来了XR实力派的降维打击。


这款最新AR眼镜,有AR的深厚技术积累,也加持了最新的AI大模型能力,还跟时尚最时尚的眼镜厂商联手。



能干什么?


一副眼镜可以等于一个真人翻译


戴上它,再也不用紧张工作会议中没听清歪果客户说啥。AR眼镜直接将听到的语音实时翻译成中文、并呈现在眼前。



赶着上班打卡来不及用手机买咖啡?


没关系,只需说一句“帮我点杯拿铁”,AR眼镜就能根据你日常习惯下单,并且支持声纹识别支付,完全无需手动操作。



导航也不再需要一直低头看手机了。戴上这副眼镜,它就能成为实时定位,用语音为你指路。



当然,它也能成为抓拍最及时的相机


点一点镜腿,萌娃的可爱瞬间立马被记录,这可比掏手机、相机快太多。



这就是最新发布的AR眼镜——Rokid Glasses


它的外形时尚轻便,几乎和普通眼镜无异,BOLON眼镜操刀外观设计。


功能上,不仅和普通AR眼镜一样具备显示能力,也集成了多模态AI能力。


必须要承认,今年智能眼镜真的火啊,不少厂商都开始布局,甚至是跨界入局。


但如果智能眼镜——公认的手机之后的下一代交互终端,就是AI+眼镜,给眼镜加个摄像头然后接大模型,那Google Glasses当年是不是太冤了?


所以现在,AR实力派玩家Rokid,用最新产品给出了回应。



把AI打碎到日常生活


从功能体验上来看,Rokid Glasses颠覆了诸多日常场景,从出行到办公、从演讲到学习……


它兼具AR眼镜、耳机、AI助手和相机的多方面能力。


最先被变革的就是拍照和摄像的体验了。


现在,只需点点镜腿,就能记录美好瞬间,支持长视频拍摄,还能一键分享朋友圈。



也兼顾耳机的能力,可以听歌、接电话等。


AI方面具备AI问答、AI搜索、AI识别、AI多语言翻译、AI实时导航、AI快速回复、AI闪记、AI转译等能力


只需唤醒“乐奇”,就能让它帮你搞定各种操作。而且响应速度非常快,语音等文本指令,在1秒内反馈完成,图像等多模态信息2秒内反馈完成。


由此,在开会时,可以让它来记录当下碰撞出的灵感火花。



或者是让AI快速回复消息,避免重要信息被遗漏。Rokid Glasses接入钉钉等软件,可以实时接收信息。


同时它也能充当实时翻译。通过麦克风拾取对话内容,乐奇就能进行翻译,并将中卫直接打在虚拟屏幕上。


这样一来,避免了人工翻译打断发言者的情况,能让双方的对话体验更流畅。



做演讲时,Rokid Glasses可以成为眼前的提词器。Rokid创始人&CEO Misa今天的现场发布,就是把题词放到了眼镜中。



外出骑行时,只需一句话即可开启AI实时导航,并将导航信息显示在虚拟屏幕上,实时规划路线。



做饭时,也能直接询问乐奇,“番茄牛腩怎么做?”它就能进行AI搜索,并将搜索结果显示在眼前。


它甚至还能解答数学题,只需咔嚓拍照,乐奇就能识别题目进行解答。Misa在发布中表示,它能解答线性方程、微积分等高阶难题。



除此之外,Rokid Glasses还具备AI转译、AI健康提醒等能力。



由于接入支小宝,用Rokid Glasses打车也只是一句话的事儿。


无论你是正在办公室/家里准备外出,还是在户外,都更专注于自己手头上的事,把打车这类小事交给眼镜。


支小宝可通过声纹识别支付,使用Rokid眼镜支付过程中,可与手机保持可信连接,并通过支付宝账户对支付做安全保障。


同时Rokid Glasses还具备物体识别能力。如果戴去博物馆,它就能识别你看到的文物/艺术品,展开介绍它的背景和故事。



在产品方面,首先在外观上,Rokid Glasses几乎和日常佩戴的眼镜无异,BOLON眼镜操刀的大框设计更显时尚。



眼镜采用一体化设计,整体重量仅49g,非常贴近于普通眼镜(大约30g),而且包含显示功能。而不包含显示能力的Ray-Ban Meta,官网标出的重量为49.2g。


同时也支持近视/散光人群镜片定制,卡扣安装即可,拆装非常方便。



但就在这副纤薄的框架中,被塞进了主板、电池等核心组件。


显示上,采用了行业领先的衍射光波导成像技术。


扬声器采用双声道高保真定向配置,保障音质同时减少声音外泄,更好保护隐私。


Rokid Glasses配备一颗1200万像素专业级摄像头,达到业内领先水平,支持竖屏模式下高清拍照和视频录制。


同时还设置了拍摄状态指示灯,在摄像头开启时,指示灯就会亮起提示。



其次底层硬件上,Rokid Glasses搭载先进的高通AR 1旗舰处理器,2GB RAM+32GB ROM存储。


AR 1不仅能为AR眼镜提供更好的拍摄、识别能力,也能充分调用AI能力增强图片视频拍摄质量等。


此外还搭配健康和运动传感器,支持用户通过点头摇头等动作触发指令。



Rokid Glasses支持蓝牙标准5.3,可以连接智能手机、平板等设备。


10分钟即可充电90%,20分钟完成满充。


同步推出了一个可充电的眼镜盒,眼镜盒满电情况下可完成10次满充。



最后在AI方面,Rokid Glasses选择整合业界领先的阿里通义千问大模型,支持完成各种多模态任务。


通义千问支持视频、图像、文字和语音等模态信息输入。通过快速识别摄像头捕捉到的物体或场景,通义千问就能进行分析判断,并通过语音或视觉反馈为用户提供相关信息。



由此,Rokid Glasses能进行物体识别、文字翻译、数学题解答等。


总结来看,Rokid Glasses将AR和AI做了更深入的融合,并希望离普通大众更近一步。


在外观上,得益于BOLON眼镜操刀设计,Rokid Glasses更符合大众审美。不仅是数码产品,更有望成为一款出街时尚单品。


一体化、轻便的机身也更利于全天候佩戴。同时,语音&触控操作都非常简单,用户可以直接上手学习。


价格上也相当友好,配备显示能力的Rokid Glasses,只需2499元。



为了保障智能化水平,Rokid Glasses和阿里合作,集成业内领先的通义千问大模型。


当然也要保障AR眼镜本身的全面能力,因此Rokid Glasses支持大量常用应用,并尝试把今年兴起的AI应用(如支小宝)也纳入生态。


由此,Rokid Glasses为AI+AR提供了一个值得参考的行业范式。


但为啥AI趋势正酣时,AI+AR的成熟范式就能被快速推出?


这得益于AR眼镜自身的发展成熟,也得益于AR和AI天生的适配性。


AI+AR正在更明确


今年,Meta Ray-Ban直接引爆AI眼镜、乃至AI硬件市场。


不同于AI Pin、 Rabbit R1的短暂火爆,Meta Ray-Ban有着实打实的成绩——发售后两个季度卖出100万副。


这意味着,在AI硬件这个赛道里,眼镜成为更被认可的形态


紧接着,Meta发布了首款AR眼镜Orion,它就是在AR的基础上进一步展现AI能力。不过这不是一款面向普通消费者的产品。而另一边,OpenAI最近也收编了Meta原AR产品负责人,有意向布局AR领域。


这些动向并非巧合,而是AI和AR天生适配的进一步外化体现。


原因还要从AR领域自身的发展看起。以已经成立10年的Rokid为例——


在2014年成立时,Rokid定位人机交互,最先在北京和硅谷成立两个实验室,A Lab 和 R Lab。A Lab 是AI,R Lab 是Reality,加在一起就是AR,也是下一代人机交互的方向



如今的Rokid以AR深入人心,但是最早发力的方向其实在AI。在深度学习浪潮席卷全球时,Rokid推出了AI音箱、开源AI交互系统。


这也一度导致Rokid被视作是一家AI公司。不过Rokid CEO祝铭明一再表示,Rokid是一家人机交互公司,只不过生逢AI技术,可以利用AI来实现更高效智能的人机交互,并能通过产品来验证技术。


这种理念很快在2016年进一步显现。


这一年,Rokid组建AI视觉团队,低调进军AR。2年后,旗下首款AR眼镜问世,Rokid在AR的布局开始清晰明了,并以每年2款产品的发布节奏,持续扩大自身布局。



在这之中,Rokid的AI浓度要比传统AR厂商更高。


比如团队花费4年时间带来的单目摄像方案。它实现了在AR眼镜上,只用1颗摄像头去做整个空间识别和3D手势。


要知道,只用一颗摄像头是难以感知空间深度信息的。Rokid通过AI生成深度信息,使得空间计算中,70-80%信息由AI合成。


带来的好处就是,单目方案可以进一步减轻眼镜自重、降低功耗,同时也能让设计更为简洁。


这使得Rokid能进一步追求AR眼镜的终极形态——一体式方案


同时,为了保障AR独立行走,Rokid还率先推出AR主机,能让AR眼镜与手机做切割,建立更原生AR的内容生态。


从2016至今,Rokid已经发布10余款AR产品。


最新发布的Rokid Glasses正是当下AR+AI趋势下,Rokid呈现的最好答案



它为如今AI应用爆发提供了新型平台,也为AR进一步智能化给出参考。


随着大模型落地趋势到来,AI应用爆发。


在移动终端上,AI应用的一个重要发展方向便是节省繁琐操作。让用户能够通过自然语言交互,完成过去复杂的屏幕操作。



对于人类而言,最自然的语言交互就是说话。说一句“帮我点杯咖啡”,比自己找APP、选品牌产品、下单支付要方便得多。


但在手机上实现这些操作,还是需要用户拿出手机、唤醒AI,会打断他本来的动作和行为。


相对而言,眼镜就是更适合的载体。它佩戴在头上,能够让用户在做其他事时,通过语音进行交互。这种天生的沉浸式和便携性,让AR眼镜更适合碎片化AI场景。



从AR领域来看,经过十余年发展,AR眼镜自身已经相对成熟。


从底层芯片、轻薄设计、显示成像以及系统开发、应用生态等,AR眼镜的软硬件都为引入AI能力打下了基础。


这使得在当下将大模型放入AR眼镜,在工程上是可行的。


Rokid Glasses就是最好的例子之一。



由此,在2024年,Rokid早早喊出的那句“AI和AR其实是一回事”,终于得到了验证。


而且,对于这种趋势的认可,不仅体现在AR、AI领域本身。各类应用生态伙伴也在以实际行动,推动AI+AR的快速前进。


阿里爱奇艺B站都来牵手合作


在Rokid最新发布上,钉钉、爱奇艺、淘宝、哔哩哔哩也官宣了一系列新合作。



在办公场景下,Rokid携手钉钉探索未来AR办公的新模式。基于YodaOS-Master平台开发的钉钉AR版本支持多屏幕联动及单应用多开等功能,可以进一步提升用户的工作效率。


娱乐场景下,爱奇艺透露正在构建一个覆盖多种设备和全场景的AR生态系统,将包括空间多屏显示、空间交互以及云台模式等新功能。并选择与Rokid进行合作探索,重塑AR娱乐格局。


购物场景下,Rokid和淘宝合作将AR引入在线购物,推出3D商品展示和虚拟样板间功能,消费者能获得更沉浸的购物体验。


教育方面和与网易有道合作,利用AR技术提供虚拟英语教师互动交流,增强学习趣味性和口语表达能力。


Rokid还与哔哩哔哩合作,为《时光代理人》IP注入AR游戏元素,使用户能够与虚拟角色互动,并在现实世界中再现动画场景。


此外,Rokid与智象未来合作,在AR设备上实现了AI生成三维内容,简化创作流程,提高生产效率与作品质量。



为啥大家都选择Rokid?


来看Rokid成立10年的成绩单——


截至目前,Rokid推出了AR Studio、AR Lite等多款产品,购买人数超过30万,且日常活跃度达到75%以上,用户日使用时长达到2h45m+


ToB方面,Rokid在文博市场占有率达到99%,用户数量突破250万。



在产品形态上,Rokid率先在行业内提出分体式设计。通过将电池、芯片、主板等核心部件从眼镜中分离到Station上,能在提高佩戴舒适度同时保障AR眼镜性能,为AR独立行走开辟道路。


在技术方案上,Rokid坚持单目摄像头识别方案。相较于行业中更为广泛的双目方案,单目方案可以让AR眼镜重量更低、结构更简单、功耗更低,并且能避免双目方案眼镜容易轻微变形、进而导致摄像头参数不准的问题。



此外,在光学方案上Rokid正在探索更面向未来的光波导路线。它能将光线沿着一个非常薄且透明的平板材料传导,将微型显示屏上的图像传递到用户眼中。


这种方案有着非常高的光线透过率(通常在80%以上),结构更紧凑轻便,能实现真正意义上的双眼显示,适合更加轻量化的AR眼镜。



另外值得一提的是,生态方面,Rokid推出了YodaOS-Master平台、灵境等供海内外开发者和创作者使用,构建了国内最大的AR开发者社区,聚集了90%专业AR开发者。其中注册开发者超过6200,企业开发者超过2500.


就在本次发布上,Rokid还推出了Station2创作版,在原有基础上增加2枚摄像头,支持空间拍照,为开发者提供拍摄功能。



并发布了Rokid Spatial Link,只需一根线连接电脑、手机、iPad、Xbox、PS5等支持DP协议的设备,就能立即开启空间显示体验。



总之,从产品、技术、生态方方面面,Rokid都早已走在了行业前列。


如今,AR+AI的方向更加明确。一时之间,各路人马都涌进这一赛道,行业内外好不热闹。


Rokid Glasses为行业提供了一种参考范式——XR厂商+时尚墨镜品牌+一流大模型,让更AI的AR眼镜,从一开始就兼顾硬件体验、好看外观和智能化体验。



AI大模型在多模态交互能力上的突破,之前给了业内这样的错觉——给眼镜加个摄像头,再集成AI能力就是下一代智能交互终端。


但Rokid也好,更早之前Meta也好,甚至苹果Vision Pro给出的方向押注也好,证明了AI对于下一代智能终端的如虎添翼,终究要建立在XR技术积累之上,或者可以更肯定的说——AR显示和交互技术基础之上。


对于智能眼镜,AI不会是谁的壁垒,AR显示和交互能力才是,丰富活跃的生态才是。


从Rokid Glasses,这一切才只是刚刚开始。


你说呢?



文章来自于“量子位”,作者“而小明”。


关键词: AI , AI眼镜 , AI硬件 , Rokid Glasses
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/

2
逆向大模型

【开源免费】kimi-free-api是一个提供长文本大模型逆向API的开渔免费技术。它支持高速流式输出、智能体对话、联网搜索、长文档解读、图像OCR、多轮对话,零配置部署,多路token支持,自动清理会话痕迹等原大模型支持的相关功能。

项目地址:https://github.com/LLM-Red-Team/kimi-free-api?tab=readme-ov-file