告别「手搓Prompt」,前美团高管创业,要让物理世界直接成为AI提示词

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
告别「手搓Prompt」,前美团高管创业,要让物理世界直接成为AI提示词
9744点击    2025-12-16 17:20

正如奥特曼执意打造硬件,试图打破手机屏束缚,要让 AI 感受物理世界;Looki 的诞生也源于同样的渴望:补齐大模型「感官智能」的最后拼图,将现实场景实时转化为上下文,驱动人机交互从「被动问答」进化为「主动共鸣」。


2025 年,AI 硬件赛道喧嚣一片。从形态各异的 AI 眼镜,到 OpenAI 传闻中的无屏设备,无数玩家正试图摆脱智能手机的束缚。其底层逻辑清晰可见,今天的 AI 不缺智商,缺乏的是「在场感」


被困在对话框里的大模型如同「缸中之脑」。当你需要复盘会议或分析孩子情绪时,却不得不将鲜活场景压缩成干巴巴的文字描述,这种依赖「手动 Prompt」的交互不仅低效,更是反人性的。我们被迫充当了 AI 的「人肉传感器」,而大模型因缺乏 Context(上下文语境),始终处于对物理数据的极度饥渴中。


「在物理世界中,人类本质上是被动的生物。我们期望让 AI 变得主动。」Looki 创始人兼 CEO 孙洋一语道破


告别「手搓Prompt」,前美团高管创业,要让物理世界直接成为AI提示词


正是带着这样的思考,一支自带自动驾驶基因的团队,试图将那套解析道路环境的「从感知到决策」逻辑复用到日常生活中,填补大模型对于物理世界的认知「盲区」。他们打造的 Looki L1,在北美市场积累首批口碑后,于今天正式面向国内发布。


这款 AI 原生多模态可穿戴设备,旨在将实时视听信号转化为模型上下文,让物理世界本身,成为驱动 AI 思考与服务你的最高效 Prompt。


一、藏在 30g 机身里的「智能感知」系统


从「车看路」到「AI 看世界」,这是自动驾驶感知算法的一次微缩实战。


如果说云端大模型是「大脑」,那么 Looki L1 就是由于算力限制而不得不外挂的「视神经」。第一眼看到 Looki L1 的人,很难不将它误解为一款挂坠形态的相机。它形态十分迷你,仅重 30g,支持磁吸或直接佩戴。


告别「手搓Prompt」,前美团高管创业,要让物理世界直接成为AI提示词


这种误解源于我们对「镜头」的固有认知,镜头生来是为了审美服务的。但对于 Looki 来说,镜头是服务于机器认知的,它本质上是一个庞大的、始终在线的多模态感知器。它不需要拍得「美」,但必须拍得「懂」。它支持 1080P/30 帧画面,待机 12 小时拍摄,就像一块海绵,全天候吸收你的光影世界。


孙洋认为,任何硬件形态都有其优劣势,AI 眼镜当下在续航、重量和功能上存在「不可能三角」。而 Looki 选择挂坠形态,则是在当前供应链能力下,为了实现「全天候静默采集」这一核心需求的最佳妥协方案


这种妥协背后,是团队技术基因的「降维打击」。


「以前是教车怎么看路,现在是教 AI 怎么看懂你的生活」,孙洋谈道。这种跨界视野,源于两位创始人独特的履历拼图。孙洋和刘博聪均毕业于卡内基梅隆大学,而在分别执掌美团智能硬件与自动驾驶算法业务之前,他们还曾在 Momenta 与 Pony.ai 两家自动驾驶企业深耕一线。


他们将自动驾驶「从环境感知到自主决策」的闭环逻辑,从道路平移到了生活场景,其感知机制体现在两个层面:


  • 首先是多维感知。它使用了多模态大模型,视觉识别场景物体,听觉捕捉环境情绪,构建起对物理世界的初步认知。
  • 其次是高效吞吐。 通过「智能间隔拍摄」技术,确保在极低功耗下实现海量视听数据的实时采集。


这套机制构成了团队从「车」迁移到「人」的底层基座,更为接下来的云端处理提供了丰富的原始数据。


二、超越 RAG,搭建一套专属用户的「数据飞轮」


从「多维数据」到「结构化记忆」,真正的壁垒在于构建一套用户专属的 Context Engineering(上下文工程)。


Looki 团队沿用自动驾驶的「数据飞轮」逻辑,来重塑用户的个人记忆:从硬件端收集数据,到建立多层级数据索引和多任务拆解,最终打造一套高效工作的 Agentic System(代理系统),让 AI 能像人脑一样,有索引、有重点地调用你的生活数据。


告别「手搓Prompt」,前美团高管创业,要让物理世界直接成为AI提示词


据 CTO 刘博聪介绍,这套系统的独创性,在于挑战了当前多模态模型的两大痛点:


首先是「长时序数据理解」。针对大模型处理大量多模态数据流(如数十万级别)容易产生「幻觉」的通病,团队通过工程优化,让 AI 能准确理解,并串联起跨度极长的时间切片。


其次是应对「多模态数据的 Context 爆炸」。视频与图像的查询会消耗巨大的上下文窗口。Looki 在云端构建了一套高效的上下文管理机制,能够根据查询需求,在海量数据中精准提取关键特征,而非粗暴地将所有素材灌入模型。


当然,这一切的基石是数据的隐私安全。Looki 通过端侧隐私过滤与 App 手动上传机制,确保数据流转的安全性。最终,物理世界的切片,被转化为结构化的「云端记忆库」。


如果说 GPT 是你工作的上下文,装载了人类的通用知识;那么 Looki 正在构建的,就是你生活的私有上下文,装载了你独一无二的经历与轨迹。


三、从「手动 Prompt」到「主动式 AI」


当语境足够丰富,交互终将进化为主动式「预判」。


目前硅谷普遍认为,我们终将迎来从 Chatbot 走向 Agentic AI(代理式 AI) 的范式转移。行业预测显示,自主 AI 代理市场将在未来三年迎来爆发性增长,而 Memory(记忆)与 Context(上下文) 正是这场进化的核心护城河。


Looki 的野心,正是基于这两者,通过可穿戴硬件构建通往「主动智能」的入口。


目前,Looki 交付给用户最显性的功能是「AI 自动剪辑」。它精准切中了那些热爱记录、却被后期剪辑劝退的用户痛点。用户在佩戴拍摄的同时,Looki 的算法自动识别一天中的高光时刻,自动生成有叙事逻辑的 Vlog。


告别「手搓Prompt」,前美团高管创业,要让物理世界直接成为AI提示词


告别「手搓Prompt」,前美团高管创业,要让物理世界直接成为AI提示词


告别「手搓Prompt」,前美团高管创业,要让物理世界直接成为AI提示词


基于这层理解,真正的质变在于「隐性洞察」。


随着记忆库的沉淀,Looki 将不再是被动等待指令的记录仪,而是能够进行推理的 Agent。它不仅记录你的饮食,更能在你点夜宵前,基于全天摄入主动发出「热量预警」;或在你情绪激动时,基于对话语境提供理性的沟通建议。


告别「手搓Prompt」,前美团高管创业,要让物理世界直接成为AI提示词


这种基于实时物理反馈的交互,让 AI 从「被动问答」进化为「主动共鸣」,这才是 AI 硬件区别于手机 App,能够真正接管用户生活的核心价值。


四、结语:当物理世界成为提示词


在 Looki 团队的构想中,硬件形态从来不是终点,而是一个「长在物理世界里的数据接口」。这也道出了 Looki 的实质:无论它今天是挂坠,还是未来演化为眼镜或耳机,其核心使命从未改变,那就是解决物理世界的数据饥渴,帮用户积累最宝贵的私有数据资产。


在 AI 时代,算力会被摩尔定律稀释,模型会被更强的版本迭代,但你在这个世界上生活过的痕迹、你眼中的风景、你与家人的对话,这些 Personal Context 构成了独一无二的你。而 Looki,就是帮你将这份资产,转化为 AI 能够理解共情的「数字直觉」。


当 AI 拥有了「在场感」,它就不再是云端那个冰冷的工具,而是你生活中的「第二大脑」。


最强大的 Prompt,其实是你未曾说出口的生活本身。


文章来自于“机器之心”,作者 “机器之心”。

关键词: AI新闻 , Looki , Looki L1 , AI硬件
AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

2
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI

3
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0