ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
AI是万灵药?Meta要把大模型塞进AR眼镜里
7998点击    2024-04-15 10:44

寻找下一块“屏幕”,这无疑是最近几年科技行业的一个热门赛道。随着个人计算机点燃了互联网,智能手机让移动互联网无处不在之后,这前后两次造富神话的出现,也让所有人都在期待下一次改变的到来。那么智能手机之后的下一代通用计算设备是什么?苹果Vision Pro代表的混合现实(MR)、Meta Quest 2代表的虚拟现实(VR)、华为Vision Glass代表的增强现实(AR),也就是扩展现实技术衍生的硬件,就成为了现阶段最被外界看好的一个方向。



只可惜,下一代通用计算设备的探索如今暂时让位于高歌猛进的AI。作为左手Oculus、右手LLaMA 2开源大模型的巨头,Meta方面似乎准备将大模型塞进AR眼镜里。就在Meta收购Oculus、并在后者的基础上创立Reality Labs十周年之际,Meta方面发布了一篇博客文章,回顾了Reality Labs过去十年的历程。


尽管通常这种自卖自夸的文章无甚价值,但在文末却透露了Meta方面准备推出一款AI+AR的产品。据Meta方面透露,全新的AR设备将同时提供与物理世界和数字内容互动的体验,以及访问Meta AI的实用性和娱乐性。


事实上,关于Meta将发布一款代号为“真AR眼镜“的消息,早在今年年初就已经广为流传。用AI来赋能AR,确实是一个解开当下AR硬件困境的可行性方案,因为即使有了苹果的Vision Pro,现阶段AR也缺乏故事可讲。



未来物理屏幕会消失,整个世界会成为你的屏幕,眼镜就会成为一个空间的浏览器,它将改变人与人、人与世界的交互方式,这就是如今业界对于AR眼镜的期许。但现阶段的AR眼镜显然还取代不了智能手机,尽管借助AR帮助使用者获得额外信息,AR硬件在工业、医疗、教育、军工、安防等企业级市场已经有了诸多案例,但就像所有面向B端的产品一样,在攻下几个大客户之后,中小客户才是更难啃的骨头。


因此消费级市场就不得不成为了AR硬件主攻的领域,可问题是用户对AR的新鲜感,早在2016年、2017年的“VR元年”就消失殆尽。



虽然在经过了多年的发展后,从技术层面来讲,通过“全反射”原理将光传输到眼睛前方、再释放出来光波导和利用镜面反射成像的Birdbath,都能制造出优秀的透视(see-through)效果,因此目前AR眼镜提供的视觉沉浸感也普遍在线,几乎不会让用户“出戏”。可是AR内容的贫瘠就远超大家的想象了,除了基于谷歌ARCore和苹果ARKit的一批样板之外,如今市面上以AR为卖点的应用可以说是少之又少,或者说从未有过一款非游戏类的AR应用出圈。


事实上,即使是AR游戏,也仅有Niantic旗下的《Ingress》和《宝可梦GO》这两款相对有影响力的产品。主打虚拟环境与现实地理位置信息结合的《Ingress》,早在2013年就已发布,它几乎是AR手游概念真正意义上的开拓者。但这款游戏更注重的是真人玩家在线下的活动,也就是“AR为皮、社交为骨”。


而真正将AR游戏概念发扬光大的则是《Pokémon Go》,并掀起了一阵在现实世界捕捉宝可梦的热潮。如果实际体验过《Pokémon Go》就会发现,其实它本身的游戏性平平无奇、AR效果也并不惊艳,它的成功靠的是把“对宝可梦进行探索捕捉、战斗以及交换”从屏幕搬到了现实里。


但《Pokémon Go》是宝可梦作为头部IP的成功,要不然Niantic后续拿着哈利波特、变形金刚、Pikmin、漫威、NBA等IP做的AR游戏,也就不会屡战屡败了。



如今的现实是自2016年的《Pokémon Go》之后,后续再无一个爆款AR应用出现,这也是为什么苹果会率先发布一个面向开发者、而非消费者的MR头显。毕竟无法想象买了AR眼镜后能做什么,这才是绝大多数消费者对于这类产品敬谢不敏的关键。别说用AR观影了,视觉沉浸感更强的VR头显都没能做到仅纯靠VR影片吸引消费者,如今无论国内的PICO、还是海外的Meta,其实都是拿游戏和健身来做卖点。


这时候,AI大模型与AR眼镜的结合,就成为了一个吸引消费者的卖点。前段时间有网友发布了一则视频,感慨在京沪高铁上打开电脑发现周围都是同类,“班味儿超过了办公室”。这一现象的背后,无疑是移动办公已经成为了相当多人生活中的一部分,而AI大模型在办公场景也开始逐渐有了存在感。别的不说,以LLaMA 2为代表的大模型在文字工作上可以说是相当擅长。



在用户给定输入与上下文生成新的文本、提取文本信息并总结、对文本内容分类、通过提示词工程自动对文本内容纠错,大模型真真切切是能提升效率的工具。Rabbit R1、Ai Pin等AI硬件为什么能在CES上搅动风云,甚至受到众多消费者的青睐,简化用户与技术的互动无疑才是关键。而AI+AR眼镜的组合同样也是如此,戴着眼镜、动动嘴就能生成PPT、写周报,相信就会吸引不少的消费者。


但唯一的问题,是语音交互的私密性不足,毕竟对着空气自言自语曾经是导致谷歌Google Glasses失败的关键。君不见,苹果在展示Vision Pro时基本都是以家庭场景为主。所以要如何解决公共场合的使用问题,或许就是Meta接下来的重点课题。


本文来自“36氪”,作者 三易生活






关键词: AI硬件 , Meta , 大模型 , AR
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI数据分析

【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。

项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file

本地安装:https://www.deepbi.com/

【开源免费airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。

项目地址:https://github.com/hitsz-ids/airda

2
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0