寻找下一块“屏幕”,这无疑是最近几年科技行业的一个热门赛道。随着个人计算机点燃了互联网,智能手机让移动互联网无处不在之后,这前后两次造富神话的出现,也让所有人都在期待下一次改变的到来。那么智能手机之后的下一代通用计算设备是什么?苹果Vision Pro代表的混合现实(MR)、Meta Quest 2代表的虚拟现实(VR)、华为Vision Glass代表的增强现实(AR),也就是扩展现实技术衍生的硬件,就成为了现阶段最被外界看好的一个方向。
只可惜,下一代通用计算设备的探索如今暂时让位于高歌猛进的AI。作为左手Oculus、右手LLaMA 2开源大模型的巨头,Meta方面似乎准备将大模型塞进AR眼镜里。就在Meta收购Oculus、并在后者的基础上创立Reality Labs十周年之际,Meta方面发布了一篇博客文章,回顾了Reality Labs过去十年的历程。
尽管通常这种自卖自夸的文章无甚价值,但在文末却透露了Meta方面准备推出一款AI+AR的产品。据Meta方面透露,全新的AR设备将同时提供与物理世界和数字内容互动的体验,以及访问Meta AI的实用性和娱乐性。
事实上,关于Meta将发布一款代号为“真AR眼镜“的消息,早在今年年初就已经广为流传。用AI来赋能AR,确实是一个解开当下AR硬件困境的可行性方案,因为即使有了苹果的Vision Pro,现阶段AR也缺乏故事可讲。
未来物理屏幕会消失,整个世界会成为你的屏幕,眼镜就会成为一个空间的浏览器,它将改变人与人、人与世界的交互方式,这就是如今业界对于AR眼镜的期许。但现阶段的AR眼镜显然还取代不了智能手机,尽管借助AR帮助使用者获得额外信息,AR硬件在工业、医疗、教育、军工、安防等企业级市场已经有了诸多案例,但就像所有面向B端的产品一样,在攻下几个大客户之后,中小客户才是更难啃的骨头。
因此消费级市场就不得不成为了AR硬件主攻的领域,可问题是用户对AR的新鲜感,早在2016年、2017年的“VR元年”就消失殆尽。
虽然在经过了多年的发展后,从技术层面来讲,通过“全反射”原理将光传输到眼睛前方、再释放出来光波导和利用镜面反射成像的Birdbath,都能制造出优秀的透视(see-through)效果,因此目前AR眼镜提供的视觉沉浸感也普遍在线,几乎不会让用户“出戏”。可是AR内容的贫瘠就远超大家的想象了,除了基于谷歌ARCore和苹果ARKit的一批样板之外,如今市面上以AR为卖点的应用可以说是少之又少,或者说从未有过一款非游戏类的AR应用出圈。
事实上,即使是AR游戏,也仅有Niantic旗下的《Ingress》和《宝可梦GO》这两款相对有影响力的产品。主打虚拟环境与现实地理位置信息结合的《Ingress》,早在2013年就已发布,它几乎是AR手游概念真正意义上的开拓者。但这款游戏更注重的是真人玩家在线下的活动,也就是“AR为皮、社交为骨”。
而真正将AR游戏概念发扬光大的则是《Pokémon Go》,并掀起了一阵在现实世界捕捉宝可梦的热潮。如果实际体验过《Pokémon Go》就会发现,其实它本身的游戏性平平无奇、AR效果也并不惊艳,它的成功靠的是把“对宝可梦进行探索捕捉、战斗以及交换”从屏幕搬到了现实里。
但《Pokémon Go》是宝可梦作为头部IP的成功,要不然Niantic后续拿着哈利波特、变形金刚、Pikmin、漫威、NBA等IP做的AR游戏,也就不会屡战屡败了。
如今的现实是自2016年的《Pokémon Go》之后,后续再无一个爆款AR应用出现,这也是为什么苹果会率先发布一个面向开发者、而非消费者的MR头显。毕竟无法想象买了AR眼镜后能做什么,这才是绝大多数消费者对于这类产品敬谢不敏的关键。别说用AR观影了,视觉沉浸感更强的VR头显都没能做到仅纯靠VR影片吸引消费者,如今无论国内的PICO、还是海外的Meta,其实都是拿游戏和健身来做卖点。
这时候,AI大模型与AR眼镜的结合,就成为了一个吸引消费者的卖点。前段时间有网友发布了一则视频,感慨在京沪高铁上打开电脑发现周围都是同类,“班味儿超过了办公室”。这一现象的背后,无疑是移动办公已经成为了相当多人生活中的一部分,而AI大模型在办公场景也开始逐渐有了存在感。别的不说,以LLaMA 2为代表的大模型在文字工作上可以说是相当擅长。
在用户给定输入与上下文生成新的文本、提取文本信息并总结、对文本内容分类、通过提示词工程自动对文本内容纠错,大模型真真切切是能提升效率的工具。Rabbit R1、Ai Pin等AI硬件为什么能在CES上搅动风云,甚至受到众多消费者的青睐,简化用户与技术的互动无疑才是关键。而AI+AR眼镜的组合同样也是如此,戴着眼镜、动动嘴就能生成PPT、写周报,相信就会吸引不少的消费者。
但唯一的问题,是语音交互的私密性不足,毕竟对着空气自言自语曾经是导致谷歌Google Glasses失败的关键。君不见,苹果在展示Vision Pro时基本都是以家庭场景为主。所以要如何解决公共场合的使用问题,或许就是Meta接下来的重点课题。
本文来自“36氪”,作者 三易生活
【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。
项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file
本地安装:https://www.deepbi.com/
【开源免费】airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。
项目地址:https://github.com/hitsz-ids/airda
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0