什么是AI硬件的最佳形态?|《原点 Talk》Vol.6

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
什么是AI硬件的最佳形态?|《原点 Talk》Vol.6
6275点击    2026-06-03 09:28

什么是AI硬件的最佳形态?|《原点 Talk》Vol.6


过去三年来,所有人都在卷模型,参数更大、推理更深、上下文更长。但当Claude Code把Anthropic推到杀手级应用的位置、当OpenAI的Codex已经能替你写完一整本游记,问题终于绕了回来:


这些越来越像「人」的模型,到底要装进什么样的载体里,才算真正走进生活?


手机给不了终极的答案。


iOS和Android不会把底层接口开放给一个第三方AI,让它24小时监听你的环境、读取你的个人信息,这关乎整个移动生态的根基。所以OpenAI自己做硬件,Meta把雷朋改造成千万级用户的入口,理想用1000多块的Livis切入一个“会说话的蔡司眼镜”,Google和眼镜厂商走到了一起做智能眼镜。每一家都在赌同一件事,手机不是AI终极的硬件形态


我们这次请到了顺福资本、行行AI合伙人李云龙,来聊这件事。


李云龙从2023年至今投了50多个AI项目,也是国内最早一批拿到Meta雷朋完全体的发烧友,更准确地说,是一个上下文工程的发烧友。他的办公桌上摆着一堆带摄像头的嵌入式小设备,每一件都在帮他收集自己生活的上下文。他说,他不是在收藏硬件,他是在为未来那个真正能替他干活的“数字分身”提前攒数据。


本期播客,李云龙戴着一副Meta雷朋。他说这副399美金的眼镜,国内同行还远没追上,不光是因为高通把AR1芯片给了Meta一年的独占期,也不光是因为Meta的光波导能做到看不见光栅区,更关键的是模型本身够不够强,能不能撑得起这个“身体”


这场对谈从Meta雷朋千万级用户,聊到Rokid杭州七小龙,从神经腕带的生物电识别,聊到苹果Vision Pro的养生态策略,从Rabbit R1为什么死掉,聊到OpenAI为什么坚持自研。


李云龙抛出了一个判断——这一代智能眼镜距离iPhone 4时刻,可能已经不远了。


【以下为本次访谈的精选内容。】


高飞:大家好,欢迎收看我们最新一期的《原点Talk》播客。我们今天要聊一聊AI硬件的话题。


AI这个领域,虽然我们很多时候用的是模型,但是这些模型到底还是需要一个硬件的载体去支撑的。比如我们现在用智能手机,这个AI硬件到底还会向什么样的方向去发展?我觉得这个议题就特别值得探讨。


今天我们也请到了李老师,跟我们一块来交流,他既是这个领域的发烧友,也是这个领域的投资人吧,要不李老师介绍一下自己。


李云龙:谢谢高飞老师的邀请。我叫李云龙,现在在顺福资本和行行AI做技术与产品的合伙人,也在做一些AI行业投资。从2023年到现在,我们大概投了50多个项目。前天跟浙大做了一个孵化器,叫GlobalAI,发掘一些在杭州比较好的项目和人才。也希望有一些好的项目,也可以找到我们,还可以去做一些投资或深入的合作。


高飞:对,一个好的节目必须能够推动商业化变现,希望有相关领域的同学可以到时候联系。


好,我们进入正题。谈到智能硬件,大多数人熟悉的还是智能手机,但是有另外一个智能硬件,就是智能眼镜,这个产品线我称之为是一个“又老又新”的产品,如果说它老的话,我记得当年Google Glass那是好多年前了嘛。


李云龙:2014年、2015年可能。


高飞:如果回过头来看,现在已经过了十几年了,但是直到今天为止,这个产品好像很新潮,却又没有成为大家的主用产品。如果看我们这期视频的同学知道,李老师现在戴的眼镜,就是一个智能眼镜。要不然先从这个眼镜开始,这是哪一款眼镜?


李云龙:Meta的这款,是跟雷朋合作的智能眼镜,但这款不带显示。Meta的AI眼镜应该算是在全球范围内做得比较早。早期,刚才你说的Google Glass,包括后来微软做的,其实后边还有一个公司,就是Snapchat。他们也做了一款摄像眼镜,但他那个眼镜是纯拍摄用的,中间有个摄像头,各种各样的,而且做的造型很夸张,Snapchat也做了几代。


但为什么当时一直没火起来?主要原因就是技术不成熟。可能受限于芯片,还有电池,各种各样的技术限制,以及很重要的AI。当时都没有大模型,只是基础的NLP,它的理解能力也不强,所以当时Google Glass一直都是开发版本,HoloLens到现在为止也没有真正对C端开放,它是ToB的,而且价格很贵,三四万。后来2023年之后,ChatGPT突然火了,Meta也开源了。Meta觉得是时候了,尤其是Meta这个名怎么改的呢,不就是想发展元宇宙。


高飞:元宇宙,对。


李云龙:对,他就一直想做可穿戴的项目,他们一开始做的Quest,VR他们现在做得也是最好的。所谓的最好,并不是说它的效果是最好的,是它的生态,它的性价比,它的用户人群。


虽然它的效果可能不如Vision Pro,但是它的性价比非常高,生态特别好,而且价格很便宜。大概三四千块钱人民币,可能在美国会更便宜。整个生态它完全做好了之后,Google说你能不能把你的改一改给我用?所以Google的Android XR最早其实就是根据Meta的这个改的。


所以,Meta在做智能眼镜方面有长期的积累,其实他们的实验室一直都在做这个事。所以他们直接找了雷朋,这是他们跟雷朋合作的最经典一个款式,这款应该是2024年发布的。这是非显示的。


如果要做成显示的,时间可能会比较长,可能不会很成熟,所以先把显示往后放,把音频、麦克风、喇叭,先把这个做到极致。


高飞:现在你戴这眼镜的话,主要的场景是什么?


李云龙:其实这个眼镜一直没在中国发售,所以呢,在国内它的用途有限。当然我采取了一些手段,已经全面支持了它原版的那些AI的功能。但是对于大部分人来说,其实在这款眼镜里是用不了AI的。


它核心的功能,就是我现在用得最多的,第一个,当个蓝牙耳机用,它不需要塞到耳朵里,我也有Airpods,可能那个是降噪的,这个平时我可能在书店、咖啡厅、跟人吃饭的时候,接个电话很自然,因为你戴眼镜嘛。


另一个就是,有一些场景,可能我出去玩,我手上可能拿着其他的东西,我不方便拿手机拍照的时候,我用它可以直接录像、拍照,我觉得这种场景比较多。但在海外啊,像美国、加拿大,他们都是第一批开放了一些AI的功能,比如AI翻译。两边人戴的眼镜是同一款。我说英语,他说中文,能互相翻译。


高飞:它这个功能是实时的。


李云龙:实时的,大概50毫秒左右的延迟,效果还是很好。


另外一个,它还有一个音频指向的功能,比如说我们在一个餐厅,想听那对小情侣在聊什么,可以打开它一个叫focus的功能,打开之后它会直接指向偷听。所以Meta这个眼镜,之前有一个发烧友叫电丸科技ak,他说Meta做了两件事,一个是把偷拍做到了极致,又把偷听做到了极致。


高飞:哈哈哈,二偷是吧?我怎么觉得这个产品调性很符合扎克伯格这个人的属性呢?因为最早Facebook就是做约会、交友的。现在看来,这个眼镜比较符合交友和社交场景。


我之前看到了一个场景,我不知道是不是真的,说戴上这眼镜之后,原则上我可以拍到一个人,因为只要拍到一个人之后呢,我就可以去查他的LinkedIn,那是不是就可以直接告诉我关于这个人的信息?也就是我社交之前,本来不认识他,开始跟他聊天时,就可以有一些,比如说彩虹屁,说:“哎,久闻大名,我早就知道你在如下领域。”这是一个可能的场景吗?


李云龙是一个可能的场景。这个新闻也是真的,国外有个学生做的实验项目,他用 API 接上 LinkedIn 和各种搜索引擎,搜到某个人之后直接问:"你是不是某某某?"那个场景对未来来说是可能的,但大厂会考虑一个问题——隐私。这件事能不能推进,取决于当地的政策和隐私环境。像欧盟就很难落地,但在美国我觉得有可能。


高飞现在雷朋这副眼镜的用户量是多少?几百万这个量级,还是千万?


李云龙应该到千万了。


高飞千万这个量级,对 Meta 这种公司来说,千万用户还不算特别大体量——它是一个亿级体量的平台。那现在主要是哪些用户群在用?


李云龙最早的一批用户群肯定是极客,想体验现在最好的可穿戴设备是什么样的。另一批是对时尚感兴趣、喜欢拍 vlog 的人。因为这副眼镜在海外是在雷朋的店里卖的,他们主打第一人称视角拍摄,所以特别喜欢拍 vlog 的人也会买。


高飞内容消费和内容创作。那道理上,像我们这样的人群也适合。这副眼镜海外售价多少钱?


李云龙399 美金。


高飞其实还好,价格不算夸张。


李云龙不算贵,我觉得算是很便宜的。其他家很难把价格降到这个程度。


高飞Meta 做这副眼镜,你觉得是赚钱的吗?


李云龙一开始我觉得是不赚钱的。它用的芯片不是高通现成的,叫 AR1。这颗芯片是高通跟 Meta 一点点合作磨出来的。这颗芯片最早是用在 Quest 那种 VR 头显上,把它移植到这种很小的 AR 眼镜上,其实不容易,涉及功耗、语音的及时性、稳定性、低延时等等,都是跟高通一点点磨出来的,整个调教过程时间会很长。


高飞那这么看的话,Meta 或者扎克伯格还是干了一件从0到1的事。如果说高通这颗芯片都是他俩一块磨出来的,等于是从一个定制芯片开始做起,最后做成了一个通用芯片(对高通来说是这样)。


这款产品,如果对照智能手机时代。智能手机最早是诺基亚做的,苹果 2007 年做了 iPhone,把这个产业带起来。你觉得 Meta 这副智能眼镜,离智能眼镜成为主流产品还有多远?1 到 10 来算,比如说一年三四亿台出货算主流产品,现在它处在历史进程的哪一阶段?


李云龙我觉得有点像 iPhone 4。


高飞iPhone 4?那已经算比较成熟了,这个评价比我想的高。


李云龙对,因为我们接触到的这副 Meta 眼镜,并不是它的完全体。它在海外是有完全体的——我戴的这副不带显示,但还有一个 Display 版本。Display 版本我上个月一直在用,因为我朋友买了,我就一直在用。


它配了一款神经腕带,戴上之后,你的手势识别方式跟苹果 Vision Pro 那种靠摄像头识别完全不同,它是靠神经腕带的。包括眼镜显示的亮度、效果,跟国内这些产品差距非常非常大。


高飞不是同一个 level。


李云龙完全不是同一个 level。而且刚才说的那颗 AR1 芯片,高通跟 Meta 调校出来之后,高通给了 Meta 一年的独占期,一年之内不能供货给其他厂商。所以其他厂商想用 AR1,至少要在一年之后,这是一个断层式的领先。


另外,Meta 那款 Display 版本,它能做到全彩。国内那些产品做的都是单绿,像 Rokid、夸克,他们用的都是单绿,Meta 那个是全彩。


但 Meta 也有局限,近视度数最高只能支持到 400 度,超过 400 度光反射会受影响,质量会下降。


高飞因为曲率的原因。


李云龙对,没法做到 400 度以上,这是局限。


高飞那它把我排除在用户之外了。


李云龙把我也排除了。我没买的主要原因就是我正好在 500 度左右。


高飞我是450度左右。


李云龙刚好超了。它散光倒还可以,但近视度数不能超过400度。另外它的电池也相对没那么好。如果一直开着用,一两个小时就没电了。


高飞你戴的款眼镜续航多久?


李云龙拍照的话能拍几百张。录像 45 分钟。


高飞也没多久。


李云龙因为它单段视频最长就 3 分钟。


高飞单段视频 3 分钟,总共能拍 45 分钟左右。


李云龙对。如果只当音频眼镜听歌,五六个小时没问题。


高飞那带出去一天应该问题不大。


李云龙问题不大,而且它有个眼镜盒可以放进去充电。


高飞对,那刚才你也提到了,国内的同行,还不能叫友商,因为可能不在一个 level。这里头不知道大家注意到没有,李老师提了一个神经腕带,这好像是一个比较新的技术,可以理解为通过手腕或手部动作做一些微操作来控制眼镜功能?


李云龙对,这目前应该是 Meta 独占的一项技术。2024 年 9 月份,Meta 有一个发布会,发布了一款眼镜叫 Orion,一副眼镜的成本就 1 万美金还是 10 万美金,我忘了,反正非常贵。当时只展示了原型机,黄仁勋还戴上了那副眼镜。它能做到什么程度?框比我现在戴的稍大一点,但体验跟 Vision Pro 差不多,Vision Pro 多重啊?六七百克。它只有 80 多克。


高飞差了接近七八倍。


李云龙对。而且它有一个单独的计算单元,把计算模块拿出来,通过无线连接。当时我觉得最震撼的不是它做得这么小,而是它的交互方式,竟然用了神经腕带。戴上之后能识别手势,识别得特别准。我一开始以为是噱头,怎么可能识别那么准?结果上个月我真用了,他们把这项技术优先下放到了第一代 Meta Display 上,我直接用了,效果非常震撼。


高飞能不能稍微描述一下,这个神经腕带操作和我们理解的普通手势操作有什么区别?大家比较熟悉的是手势操作,需要把手对着摄像头挥一下,那神经腕带是什么逻辑?


李云龙它可以放在兜里。


高飞把手放在兜里?


李云龙对,手放在兜里。我们的手在动的时候,会发生一些细微的电变化。


高飞生物电,对吧?


李云龙对,生物电。各种细微的变化。这本质上也是有了 AI 之后才做到的,他们用了大量训练数据。


高飞有点像机器学习,知道不同手部动作对应的生物电特征。


李云龙对,然后把算法集成到腕带里。


高飞举个例子,两个手指捏一起和三个手指捏一起,或者旋转一下,生物电就变成一种可识别的模式或特征,这种模式再跟眼镜里的操作做对应关系。


李云龙就类似电脑鼠标的左键、右键。它确实有旋转。


高飞有旋转?


李云龙对,有旋转、有长按、有捏一下,各种功能。


高飞而且它不需要摄像头看到,我手放兜里,一捏就能拍照。


李云龙每个手指它都能识别,食指、中指它都能识别。


高飞需要训练吗?还是上来就能用?


李云龙不需要训练,但需要它教你一遍,你操作一遍就行。


高飞那说明手部生物电每个人的特征都差不多,不需要额外建模?我记得用其他一些设备的时候要经过一轮建模,像 AirPods 都需要,得转一下头。这个不需要?


李云龙不需要。是一个相对标准的。


高飞很先进的技术。


李云龙但这个"标准"背后,是他们在这方面下了很大的功夫去研究、训练算法。我觉得 Meta 这一块的技术还是很厉害的。


高飞谈完海外,我们回到国内玩家。你觉得国内这些玩家现在处在一个什么阶段?主要的使用场景是哪些?


李云龙国内的我用过 Rokid Glasses,两个镜片都是绿色那种。Rokid 这款产品现在也是国内卖得最火的,他们融资轮数也是最多的。现在好多国企,包括一些做眼镜的都跟他们合作、投资。他们是杭州七小龙之一。


高飞七小龙,现在是六小龙加宇树。


李云龙对,Rokid 我觉得很厉害。第一,发布得够早,是国内第一批发布 AR 眼镜的。第二,他们的生态足够成熟。


所谓生态,第一是他们最早跟高德合作做了眼镜导航;第二是接了足够多的模型,海内外版本都把模型接全了,国内的 DeepSeek、通义千问各种模型全接了,国外的 ChatGPT、Claude,新的一出来立马就接。


他们对生态建设非常积极,开发者版本、各种 SDK 更新得非常频繁,甚至在眼镜上做了一些小游戏。因为他们的芯片也是用的 AR1,AR1 可以跑安卓。虽然我觉得有些方向不太对,比如非要在眼镜上跑游戏,没什么意义,但生态有人玩,说明社区建立得不错。最常用的还是宣传的那些:翻译、拍照、支付、导航,基本就这些。


高飞也就是说这款产品魔改空间比较大。这让我想到以前玩路由器,应该是华硕路由器,大家很喜欢刷固件。


李云龙梅林。


高飞对,梅林。所以那个路由器形成了一个广大的粉丝群体。Rokid 也有这种特征。


李云龙而且是官方支持。


高飞官方支持大家一起魔改。那还有哪两家?比如夸克是什么情况?


李云龙夸克他们整个硬件设计团队非常用心,做了很多硬件优化。比如他们后面那块电池,换电池的时候是不断电的,里面有一个足够大的电容,能保证你 5 秒、10 秒不断电。


高飞那么大电容吗?有点夸张。


李云龙他们做了一些细节优化。


高飞能看到一些小细节的用心。


李云龙但国内这些带显示的眼镜,包括夸克,都有一个很大的问题,就是光栅区。比如我们对面聊天,你能看到我这有个屏幕。


高飞就是那个绿色的,很明显。


李云龙对,那叫光栅区,一直在那闪。但 Meta 一点都看不见。


高飞这个能看到和看不到,工程难度差在哪?


李云龙非常大。它是靠光的折射,光在里面不停折射。


高飞光波导,对吧?


云龙对,光波导技术。国内这些用的都是同一家公司的方案,比较成熟,但没法规避光栅区的问题。


Meta 的解决方案问题在哪?出厂的时候这个镜片必须是他们配的。夸克也是这样,但夸克只解决了"够薄"的问题,它出厂也是要现配,买了无度数的之后不能再加度数。Rokid 是有一个夹片,跟墨镜夹片一样放上去。夸克只是把它变薄,但光栅问题还是没解决。而且光栅这个事解决起来,是需要基础科学团队的。


高飞属于物理、材料这个领域。


李云龙而且投入很大。所以目前这块技术又是 Meta 独占,只有 Meta 解决了。


高飞这个其实挺影响用户体验的。比如我们两个交流,看不到光栅,我会默认我们就是正常交流;但看到了之后,我可能会心里有点不舒服,觉得你在分神。我们俩聊天的时候,你已经神游天外了,是吧?特别是想象一些约会场景,女生正在说话,男生你是不是已经在收发邮件了?是不是在打工?还是在专心看电影?这个影响挺大。


李云龙对,有时候有可能闹情绪。


高飞跟我在一起,是不是还在收邮件?是不是在装 Claude?大家会想得比较多。所以我觉得这种细节问题有时候会决定消费级产品的成败。


李云龙对,这也是目前 AR 眼镜最大的问题。国内没有任何一家公司能解决,只有 Meta 解决了。


高飞那如果谈非显示的眼镜,比如理想推了一个 Livis,它是不带显示的,只有音频、耳机,我称之为"音频版智能眼镜"。你怎么看这类产品?


李云龙理想这款出来之后评价特别好。评价好的原因是,它只解决几个痛点。


第一,它单纯就是替代一个蓝牙耳机;第二,反应速度很快,用单音节激活;第三,里面用了一个很小的端侧模型,没有 AR1 那么重的芯片,续航能保证,延时非常低;第四,它非常轻,因为没有额外组件,用的芯片也足够省电;最重要的是价格,1000 多块钱,蔡司的镜片,一下就卖爆了。


高飞因为一副普通墨镜有时候也卖这么贵。


李云龙对,它做这件事的逻辑是,首先把它当成一副眼镜来做,而不是先当成一个电子产品、数码产品。


高飞所以李想这个人做产品还是有点道行的。


李云龙对。其他家都在用同一颗芯片,恒玄 2700、2800 那种芯片,加上AR他直接不用,只用一个最基础的方案。


高飞因为它的功能足够单一,只解决麦克风和录音的问题,所以也不需要那么高性能的芯片。


李云龙对。


高飞那它的使用场景是和车机交互吗?


李云龙跟车机交互是一部分,但我觉得更多还是平时的场景,比如听歌、拍照。


高飞相当于眼镜版的蓝牙耳机加上一个拍照设备。那这样也谈不上是智能眼镜,顶多是个感知设备。


李云龙但它可以通过蓝牙连到手机上,唤醒手机的 AI 助手。


高飞用手机的算力来解决眼镜的智能交互问题。


李云龙它其实没用手机的算力,用的是云端算力。


高飞云端算力。那是模型优化得好或者链路优化得好,所以低延时不错。


李云龙对。其实我们忽略了一个问题,理想这家公司前段时间发布了自己的车机推理芯片。他们有能力自研推理芯片,所以完全可以自己生产芯片去跑自己的小模型。


高飞所以理想也算是一家有端到端能力的公司。


李云龙对。


高飞聊完这几家,还有两个重要玩家可以聊聊——苹果和三星。智能硬件时代这两家是曾经的两个第一,苹果是智能手机的开创者,三星是后来居上的全球第一(除中国市场之外)。现在这两个玩家市场上怎么看?


先说苹果,Vision Pro 你觉得处在什么阶段?苹果接下来可能会做哪些事?正好过两天苹果的开发者大会要开了。


李云龙Vision Pro 这个设备是一个试验田,它是未来苹果做 AR 眼镜(像 Meta Display 那种版本)的试验田。


到现在为止,Vision Pro 卖得也不多,基本是发烧友、极端发烧友,加上一部分开发者用户,再加上一些开店做演示用的。比如租赁演示。


但他整个生态做得特别好,因为系统底层用的是 iOS 和 Mac,APP 现在也已经不少了。当生态做得足够大的时候,他把这个设备的体积做到普通眼镜那么大,一下就起来了。


高飞所以可以理解为他用这款产品养了一个生态。等生态养起来、硬件 ready 了,这个产品还有很大机会。


李云龙对,他现在就是在提前布局生态,先让真正觉得有用的人去玩,去给他开发所有 APP。我觉得这步棋下得挺好。


高飞比较长久。他并不是把这个产品当作临时性、阶段性的产品?


李云龙一定会继续做下去。可能会换一种形态,比如做得更小,可能会出 AR 版本,这不确定,但这个生态他一定不会放弃。


高飞三星在这个市场什么表现?


李云龙三星前段时间也发布了一个 XR 设备,我看评测说一般,就是谷歌原生 XR 系统搬过来。三星的问题是生态问题,其实不光是三星的问题,是谷歌安卓的问题。


高飞太碎片化了,对开发者的影响力不像苹果那么紧密。


李云龙因为它的系统是谷歌的,手机又是自己的。不像苹果系统、芯片、设备都是自己的,这就是它最大的问题。Meta 起码还深度魔改了安卓,自己做了一套生态。三星压根没去做生态。


高飞这么看的话,三星能不能在智能眼镜上做好,很大程度上依赖谷歌。如果谷歌足够努力,三星可能跟着带飞。三星其他工程能力很强,芯片、显示,所有硬件都不缺,只要谷歌把软件解决了就差不多。我们稍后聊模型那段时谈谈谷歌吧。


我们先跳到另一家公司——OpenAI。众所周知,OpenAI 是一家对智能硬件怀有极大热情的公司。在 Anthropic 的 Claude Code 借着 AI Coding 把 OpenAI 打得稍显狼狈之前,OpenAI 的主要精力是放在消费产品和消费硬件上的。Anthropic 用 Coding 把它的收入和估值打下来之后,OpenAI 才稍微放弃一点热情。但我觉得它在这个领域应该也是认真的。


刚才录节目之前我跟你聊了,OpenAI 跟苹果前首席设计师乔尼·艾维(Jony Ive)的公司 LoveFrom 合作。


李云龙对,好像是。


高飞好像叫 LoveFrom 什么的,OpenAI 还把它收购了。目前透露出来的产品方向,最初看起来有点像 Humane AI Pin 那样的产品,好像没什么太多技术含量?是不是我得到的信息不够?李老师怎么看?


李云龙是这样。在 Anthropic 做 Coding Agent 和 Claude Code 之前,OpenAI 整个都在为 C 端服务,它想在 C 端占足够多的份额。Anthropic 是 To B 的。


所以 OpenAI 这家公司有不同团队做不同的 C 端产品,硬件也是他们比较看重的。我觉得主要原因可以一句话总结——OpenAI 认为,AI 的终极硬件形态不是手机


很简单,手机分成两大阵营,安卓和 iOS,也就是谷歌和苹果。他们不会在底层开放接口,让 AI 全天候监听你的环境、读取你的个人信息,一定不会开放这个口。


但 AI 发展到现在,最重要的不是后面的模型有多大,模型可能已经是上一轮的事了。现在到 OpenAI,为什么一出来大家都觉得这 AI 像是一个人?原因就是足够多的上下文,它要足够多地了解你,你才会觉得它真正好用。


所谓"足够多的上下文",普通人的上下文哪有那么多?其实就是每天的生活工作,这需要硬件去记录。手机不开放这个口,OpenAI 就只能自研。


它现在曝光了两款硬件,一款是耳机,另一款是带摄像头的。


高飞好像就是一个装在口袋里的,一个别在身上的。


李云龙为什么是这两种形态?耳机主要是听你个人的声音。


高飞比如我自己的想法。


李云龙对,碎碎念、好的 idea,赶紧说一下,AI 把它记下来。


另一方面是记录环境信息。举个例子,我们开会,可能有人在放 PPT,有个大屏。开会光靠麦克风不够,你又不可能一直拿着手机拍。所以那种硬件可能每隔 5 秒或 10 秒拍一张环境图,把照片给到 AI 去分析。再加上环境音、周围信息,可能还有更多传感器,把这些作为上下文给到 AI 之后。举个例子,我出去玩了一天,晚上它自动给我生成一个游记、自动给我剪辑一个视频。


我前段时间不是去澳门嘛,正好在那待了一天,我就想试试这个事,到底能不能做到。我用眼镜疯狂拍照,因为电池不行,只能拍照,去到每个地方还拿着手机不停地讲:"我现在在哪,我的想法是什么,我为什么觉得这怎么样。"晚上回来,我把这些都导出来,转成文本,眼镜的照片直接导出来放进文件夹,丢给 Codex,让它帮我整理生成一份游记。生成出来图文并茂、有目录,特别好。


高飞很完美。


李云龙对,当时就觉得未来一定会有这样的硬件。


高飞你等于是手搓了一个,通过模型、Codex、眼镜手搓了一遍。但未来这个硬件应该是工程化、规模化的,可以丝滑地把这个任务完成。


李云龙对。其实很多人都想记录生活——你看大疆 Pocket 为什么卖那么火?每个人都想记录。但发愁在哪?他们不想剪辑,不会剪辑。


高飞我只想拍、只想录。


李云龙我想记下来。


高飞不想有后期工作。跟我一样,我一直想做视频,但后期对我来说太难了。


李云龙很痛苦。包括写小说、写书也一样。那为什么不让 AI 去做这件事?我只要结果就好。AI 看到的跟你看到的是一样的东西,相当于把你的人生记下来了。最后这些上下文,视频也好、整理出来的小说、自传也好,是未来真正的数字分身的那一步。


这就是为什么 OpenAI 一定要做硬件。它认为手机不会开放这种接口,手机不是最终的 AI 硬件形态。


高飞就像豆包一样。做完之后发现谁都拦着它、防着它。手机本来就不是一个为"记录上下文"准备的产品,手机更像一个身份认证系统,接了银行、证券、身份证,它已经变成我们的数字指纹。当年办什么业务都要去银行,现在拿手机就行,所以从底层上手机就没法做这件事。


李云龙手机上不愿意开放,是因为这些 APP 厂商如果把口开给豆包,他们就没了。


高飞豆包就把它们跳过去了。


李云龙对,因为最终就是一个对话框就够了。


高飞有道理。


李云龙但未来我觉得这件事怎么逃都逃不了。


高飞那这里的问题是,为什么 OpenAI 做的产品不是眼镜?现在流传出来的,要么装口袋里、要么别身上,为什么不做眼镜?当然这个也没什么实证,没准它推出来就是眼镜。你怎么看?


李云龙我觉得眼镜还是有一些弊端的。


第一,有些人不喜欢戴眼镜。第二,眼镜不是一个 24 小时能追踪你的形态,晚上眼镜可能需要充电,要放到其他地方,而且不方便换电池。小硬件就可以随时换电池。第三,是隐私问题——摄像头。硬件揣在身上的时候摄像头是关的,戴眼镜的时候摄像头始终开着,对面的人会不放心。所以眼镜有局限性。


高飞没错,如果一屋子人每个人都戴这种眼镜,对社交会形成巨大影响。我们必须默认每句话都可能被拍下来传出去。


李云龙所以我觉得眼镜可能会做,但不是第一批。第一批更可能是耳机或者挂在身上的摄像头。


高飞这类产品其实早两年火过。大概两年前 MWC 的时候,有几个产品像 Rabbit、AI Pin。那时候叫 AI Pin。那时候没做起来,为什么?


李云龙Rabbit R1 没做起来,一个原因是它只是在安卓上稍微改了一下。当时 Agent 也不成熟,它想替代手机,但其实替代不了。它想在上面点外卖、打车,但当时实测点外卖必须走五六轮,因为 Agent 能力不强,模型能力不强,而且模型也不是自己的。它要替代手机,怎么可能替代?我还要拿手机看视频、刷视频,它那屏幕那么小。


高飞明白。这么看,当年的步子迈得有点大。它把自己定位成了手机的平替。当年 Google Glass 也是想做手机的平替。而现在 OpenAI 做这个东西不是手机的平替,是模型的眼睛、耳朵、嘴巴,是模型的外延身体


李云龙Rabbit R1 没做起来的主要原因是模型能力没达到,而且他们自己没有模型,说白了就是没有大脑,只做了个壳。


高飞等于两头在外。硬件也就那么回事,又没有模型,本质上是个套壳,而且是缩小版的套壳,没有那么多机会。


李云龙但 OpenAI 不一样,它有大脑。


高飞有大脑。


李云龙模型能力足够强,现在就是缺个眼睛。


高飞对。


李云龙你看 Claude Code 不就是一个控制电脑的"手"嘛,它一下就火了。


高飞有道理。哪怕在手机里装 Codex,然后能控制一下电脑里的 Codex,这都是一个场景。OpenAI 希望从一个聊天窗口延伸出来,进入到生活的更大范围。


那说到这,有一个玩家没聊到——谷歌(或者说 Alphabet,旗下的 Google、Google DeepMind)。它有两个方向值得聊:第一是安卓生态如果要把眼镜做好,离不开谷歌;第二是它在模型领域也有很强存在感,前两天推了一个 Gemma 4 端侧模型,李老师有没有体验过?现在评价如何?


李云龙Gemma 4 现在应该是开源端侧模型里能力最强的,比如 4B 模型这个量级,它可能是最强的。


高飞断崖领先?


李云龙断崖领先。他们的 2B 和 4B 我已经移植到鸿蒙原生 Next 系统上了,我已经开源了。


高飞这是手搓,把两个生态搓在一块了。


李云龙底层是阿里在适配,阿里做了一个手机的极简推理框架,我只是适配了一下。效果还不错,也就是说现在在端侧运行模型是可能的,但只是运行模型而已。


高飞他没有额外的东西,只是把模型跑起来。那这个产品对未来智能硬件的作用有多大?端侧模型是不是必须的?还是说通过网络带宽加云端模型就可以解决?


李云龙端侧模型和云端模型都需要,要做协同。现在有一个比较好的案例——苹果的 Apple Intelligence,端侧加云端。它做得好的地方是云端和本地的协同。


为什么需要这种协同?因为本地的模型要保障你的隐私。比如 Apple Intelligence 有一些功能,像总结你的推送,一小时来 20 条推送,直接给你总结一下。但这个总结要传到云端,可能涉及微信消息。


高飞微信的、银行的,各种信息都可能有。


李云龙你让云端做就不太合适,但用 1B、2B 的模型本地做总结就足够了。


另外,个人信息(比如今天走了多少步、心率、各种健康数据)传到云端也不太放心,有些人就在乎这方面的隐私。靠本地模型是够的。所以本地模型不像传统大模型那样追求极致通用,而是某种场景下能用。这是必须的。


高飞说到隐私这事,大家可能没感觉,但前两天我作为微博 AI 博主,大家吵得最热的一个话题就是 DeepSeek 的 thinking 思考过程泄露了,可能是 KV cache 没管理好,你打一个 think 标签给 DeepSeek,它会随机显示别人的思考过程。


这部分道理上不算用户隐,因为不是用户输入的,但里面包含了用户输入的部分 prompt。比如有人问"我遇到什么问题应该怎么解决",里面就把这个问题说了。测试了一下,确实直接返回了很多。其实这是一个隐私问题,万一碰到坏人,把思考过程泄露出来,往小了说是个人隐私,往大了说工作中可能出现泄密。这其实挺吓人的。


李云龙这是工程上的安全问题。如果你足够在乎自己的隐私,就不要用这种在线模型,自己搭一个。当你给到 DeepSeek 的时候,背后的安全就......


高飞你已经交给别人了。


李云龙对,就不好说了。


高飞既然你已经用云端模型了,就别指望这事在你家保险箱里。


李云龙对。所以好多企业还是想自己部署一个小一点的模型,比如 80B、100B 的。


高飞今天,准确说应该是昨天,戴尔召开了全球技术大会,请了黄仁勋到场,麦克·戴尔和黄仁勋做了一场对话。我仔细看了一下,他们的核心对话是说有好多企业向戴尔要求把模型放在本地。


这种模式国外跑得还挺有意思。比如 Google DeepMind 把 Gemini 3.1 部署到用户的数据中心做本地推理。我们在国内用云的时候好像是直接在他们的云上用,但它不是,是你自建数据中心,谷歌把模型推到你本地,跟原生使用差不多。等于谷歌和算力公司帮你做一个模型的本地推理版本。这种模式你怎么看?


李云龙我觉得从模型发展来说,这是介于闭源和开源中间的一种选择。


高飞它还是闭源的。


李云龙相当于一种本地部署。其实这也不是第一家做这事的,他们和 Amazon、Cursor 都做过类似的合作。当一家企业想用业界最好的模型,但又不想把数据给模型公司,这个选择我觉得是可以的,双方共赢。


高飞早期智谱 AI 也做了很多本地化私有化部署。开源之后用户可以自己买算力和推理引擎部署,但闭源时代确实是这种方式。


李云龙在一些场景是够用的,它不需要那么快迭代,可能觉得 Gemini 3.1 Pro 的性能足够了,一两年内不需要换。但另一部分企业想时时刻刻体验最新模型,这种你给他部署也比较难,因为模型公司懒得更新。


高飞如果这些公司足够有钱,模型公司为什么要拒绝呢?你要私有化部署,我就给你一份。


那刚才你也提到,来录节目之前你正好去了一家被投公司,是做硬件的吗?


李云龙可以这么讲。它就是一个Claw盒子。但我们不是那种比较泛的Claw盒子,我们针对具体的行业,比如酒店类、潮玩玩具类,给他们预置了一些 Skills,直接给老板用。他不需要自己折腾安装那些东西。


本质上这是一台 Windows 小主机,我们给它完全魔改。软件直接就是 Claude,所有 token 走我们的平台。Skills、tools(比如生图、生视频)都已经接好,开箱即用。


高飞而且垂直到某个行业了,更端到端,开箱即用的味道。


李云龙对。如果做泛化、通用的,我觉得机会不大。因为通用的东西,大模型厂商会把你干死。只要一个东西非常通用,大模型厂商一是有这个能力,二是觉得这个市场太小。


高飞可以等,等你把市场做起来我再做。


李云龙对,Anthropic 一直在做这个事。


高飞等创业公司把应用做得差不多了,Anthropic 就下场。


李云龙对,Anthropic 一旦发布一个新产品,一大片创业公司......


高飞哀嚎。这家公司真的是杀手级,不是杀手级应用,是杀手级公司。太恐怖了。现在谷歌对智能眼镜这个产品关注度怎么样?


李云龙还挺关注的。他们跟国内一家公司 XREAL 在做深度合作,想先把眼镜里的 Pixel(他们手机叫 Pixel)先打造出来,他们也想做生态。谷歌不是要一家独大,他一定要把生态建起来,因为现在眼镜最大的问题就是生态问题。


高飞内容和应用的问题。


李云龙对。你没有杀手级场景。现在你说 AI 眼镜有什么杀手级场景?我觉得最基础的就是拍照和录像,这就是最杀手级的。


高飞我觉得 Meta 那个 Focus 是个杀手级场景,在某个场景中偷听。偷听跟偷拍那是杀手级,只有杀手才会用的产品,哈哈。


好,我们还有一个公司没聊,但其实一直无处不在——高通。似乎不在,但又无处不在。刚才你提到高通在这个领域是独占级别的,跟 Meta 合作研发了这款产品,应该说是这个领域最好的一颗芯片。


李云龙对,但这颗芯片其实算比较老。比较老的原因是行业内没有人跟它竞争,友商不努力,只有它自己一颗芯片。所以 AR1 现在耗电量还是很大。如果把这块解决了,性能是足够的。另一个问题是没有哪个场景、哪个应用能把它的芯片跑满。


高飞算力没用足。


李云龙这是最大的问题。其实真正用 AR 跑的那些 APP 都没用到它的算力,纯端侧的算力几乎没用到。


高飞这是一颗 SOC 吧?


李云龙是 SOC。


高飞那就是把通信等模块都集成在里面。


李云龙对,都集成在里面——蓝牙、Wi-Fi 全在里面。


高飞这事确实只有高通能做。给不太了解的同学一个背景,做一颗算力芯片不一定那么难,AI 时代就是矩阵运算,这事不太困难。但做 SOC 是另一回事,蓝牙、通信这些模块,第一有大量技术,第二有大量专利积累,一般公司玩不了这种芯片。


我记得早几年,英伟达想做一款手机芯片,做了一段时间发现做不了,专利护城河太深,就放弃了。后来这款产品去掉了通信能力,变成一个相对纯计算单元的芯片,用在了汽车上。


所以这个领域高通确实是独一无二的玩家。高通每年的骁龙技术峰会,我们的记者每年都参加,确实感觉每年峰会里都有一个环节关于 XR、AR,感觉高通也没放弃过这款产品。


我记得是去年,高通 CEO 安蒙也说,他们一件事做了很多年,当时他举了 5G 的例子,说当时大家觉得这事没什么可说的、放弃了,但他们还在做。


元宇宙这件事好像大家也觉得不那么重要了,但高通一直没放弃,从实际情况看确实如此。一直是这么一家专注的公司。


最后我们花点时间聊聊李老师的另一个主业——投资。请李老师谈谈,不止于 AI 硬件,泛 AI 范畴现在你看到哪些好的机会?什么样的项目你比较看好?什么样的创业者你比较看好?因为有时候投项目其实是投人,我们可以从两个维度分析。


李云龙从创业者的角度,第一个就是专注度


高飞专注度。


李云龙他可能一直在做这件事,创业有几轮了,一直做一件事。首先这个人是不会放弃自己创业项目的——或者会换一些赛道,但一直在创业。这种人我觉得可以。


另一种是本身背景特别好,而且一直扎根在这个方向的。比如做机器人模型、具身智能模型的,他可能从硕士、博士阶段就一直扎根在这个方向,毕业也想从事这个方向创业。


高飞没准小时候就有这样的梦想。


李云龙对。这种人从人的角度是可以的。一种是刚毕业还没毕业的,一种是一直在创业的老兵,始终不渝不放弃。这种我们会加分。


从项目角度,这几年我们投项目,因为 AI 发展太快,每一年看重的东西不一样。今年我们更看重端到端的交付,AI 在中间可能帮你节省成本或提高效率,但最终交付给用户的那个产品,是不是用户喜欢的、想要的。就像我们刚才说的那个Claw盒子。


高飞那正好是端到端解决了用户痛点。


李云龙对,一定是端到端的。如果你只是中间某个环节,举个例子,最近很火的各种 AI 生成短剧的平台、工具,我觉得意义不大。原因是工具平权,创意不会平权


字节自己做的那个小云雀做 AI 短剧,一个非常厉害的导演跟我同时用那个平台去生成一个小电影,谁做出来的品质更高?肯定是那个导演,因为创意、经验都在他脑子里,工具只是同样的工具。


很多人觉得 C 端工具一出来"我也能做视频、做短剧",但没真正对比过,真正有经验的人做出来是什么样的产品。


短剧现在很卷,我们投了几家短剧公司。去年我们投这种工具类的产品可能还会投,但今年我们不这样看了,需要你提供端到端的解决方案。


原来的方向可能是 80% 懂 AI、20% 懂业务就够了。现在反过来,你要 80% 懂业务,在某个方向有沉淀、有自己的 know-how,20% 懂 AI。因为现在 AI 模型能力足够强了,你只要稍微懂一点,用 AI 就比原来花 80% 精力做得好得多。


高飞也就是模型这件事被商品化了、平权了。但对业务的洞察、行业的积累,这个东西很难平权。如果能把这种行业洞察和积累产品化,让另外的人拿来直接交付一种结果。用一个比较庸俗的话说,原来这种工具有点像 SaaS,哪怕用 token 计费,也是按时间或量计费的产品,我都称之为变种 SaaS。


而你说的这个有点像以结果付费——Result as a Service,直接交付一种 KPI。这样的产品可能会变得很有价值。


我能最后再问一个个人的小问题,李老师为什么个人这么关注智能眼镜、消费硬件?这东西第一不那么成熟,第二还挺贵的,这个热爱是怎么养起来的?刚才你也提到,很多时候把一件事做好是热爱产生的。


李云龙其实我做这些事,首先因为我懒


我买 Meta 这副眼镜,是因为我不想拿着手机举着去拍照、录视频。但我又在 AI 行业,知道未来的 AI 要想足够懂你,一定要有足够多的上下文。所以我会买大量这种能获取个人和周围上下文的工具——眼镜、手表,还有办公桌上摆的一堆嵌入式小设备,上面带摄像头,可以扫小字,各种各样的东西。包括 AI 转录的那种硬件,我自己也写了一个。


我弄了一堆这种东西,本质上都是在收集我的上下文。为了未来那个足够好用的数字分身。数字分身是要帮我干活的。所以本质上还是懒。


高飞明白。所以大家不要误解,李老师不是消费硬件发烧友,是上下文工程的发烧友。最终是为了练出自己的,要炼丹嘛,个人炼丹,元婴二期,根据上下文修出来的 AI,最后能帮我们干活,让我们更多享受生活。也就是懒。我觉得这才是最终目的。


李云龙对。未来一定是看你怎么用好 AI,把它当作自己真正的个人数字助手,或者真的能帮你干活——就像 Claude Code,能帮你干各种各样的活。但未来具身智能出来的那一天,怎么把你的"脑子"给到那个具身智能的躯体?这非常重要。我现在就在为这件事做准备。


高飞我对这个观点特别赞同。因为我是个漫画爱好者,《JoJo 的奇妙冒险》里有个设定,每个人都有一个替身,这个替身是精神能量的聚集,有超能力。


我写的公众号就叫"高飞的电子替身"。用"电子"这个词,是考虑到有时候这个替身不一定是数字化的,可能是带身体的。"电子"形容它可能是带身体的,正好和我们今天这个节目契合:未来我们的分身也可能有自己的"住房",这个硬件就是我们分身的住房。


特别感谢李老师,今天收获很大,我们从硬件角度、投资角度,还有李老师为什么对消费硬件感兴趣这件事做了一个很好的梳理。也感谢大家收看这期节目,我们下期再见,拜拜。


李云龙拜拜。


文章来自于"科技行者",作者 "原点Talk"。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI漫画

【开源免费】ai-comic-factory是一个利用AI生成漫画的创作工具。该项目通过大语言模型和扩散模型的组合使用,可以让没有任何绘画基础的用户完成属于自己的漫画创作。

项目地址:https://github.com/jbilcke-hf/ai-comic-factory?tab=readme-ov-file

在线使用:https://aicomicfactory.app/

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
AI搜索

【开源免费】MindSearch是一个模仿人类思考方式的AI搜索引擎框架,其性能可与 Perplexity和ChatGPT-Web相媲美。

项目地址:https://github.com/InternLM/MindSearch

在线使用:https://mindsearch.openxlab.org.cn/


【开源免费】Morphic是一个由AI驱动的搜索引擎。该项目开源免费,搜索结果包含文本,图片,视频等各种AI搜索所需要的必备功能。相对于其他开源AI搜索项目,测试搜索结果最好。

项目地址:https://github.com/miurla/morphic/tree/main

在线使用:https://www.morphic.sh/

4
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0