ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
从1980年以来的硅谷PC创新,看AI硬件的时代机遇
8637点击    2024-11-09 13:09


11月5日,消费硬件领域有了重要的人事变动,Meta AR眼镜业务负责人Caitlin Kalinowski正式加盟OpenAI,担任机器人和消费硬件负责人。媒体评论称,“这预示着OpenAI不仅要在软件领域称霸,更野心勃勃地想要通过硬件产品重新定义人机交互的未来”。


如今市场中已经出现了一些基于AI技术的硬件产品,巨头入局,会让这个市场发生什么样的变化?究竟哪些因素影响着消费硬件的发展走向?具备什么样优势的硬件能够一枝独秀,避开与电脑、手机这类强势通用设备的竞争?


借用桥水基金创始人瑞·达利欧(Ray Dalio)的一句话:“历史虽不完全相同,但历史的模式常常重复。”或许我们能从早期硅谷软硬件企业的创业创新中,为当下的AI硬件创新找到一些思路。


冰鲸科技创始人潘鑫磊详细研究了硬件行业的发展历史。在梳理了1980年代的芯片革新、PC的起步与渗透、1980-1990年的Dos与Windows 1.0系统变化之后,他发现芯片、系统、应用以及人机交互方式这四个关键因素不断迭代,相互促进,深刻影响了PC产业的生态演进。


回到当下,AI大模型的出现,让四要素发生了变化。在芯片层面,GPU、TPU等芯片让算力不断提升;在系统层面,大模型可能会逐渐与系统融为一体;在终端层面,用户与设备交互产生的私有化数据会更有价值;前三个要素的变化,也会催生出新的应用。我们或许会见证一种全新的存算一体的计算设备的诞生。未来,它的地位可能与手机、笔记本,甚至公有云都有所不同。


我们将潘鑫磊在峰瑞的内部分享编辑成文,峰瑞资本投资人孟长洁在文末补充分享了对AI硬件领域的投资思考,希望能提供新的视角。



一、PC崛起、信息化进程,与硬件发展四要素


20 世纪 80 至 90 年代,是PC崛起的第一个头十年。PC行业的发展可以被简单概括为:始于硬件,兴于应用,终于生态。


这一时期的前五年,芯片技术的突破、IBM PC的发布、再到WordPerfect 等大量生产力应用的繁荣,推动了PC上半场的蓬勃发展。在下半场,GUI(图形交互界面)与图形应用崛起。在“激烈厮杀”中,微软逐渐成为“生态级玩家”,其发布的Office,逐渐吞并原有应用层的产品,为1990-2000年的第二曲线打下了扎实基础。


梳理PC硬件发展的过程中,我发现了四个关键因素,分别是芯片、系统、应用以及人机交互方式。这些关键因素不断迭代,相互促进,深刻影响了PC产业的生态演进。


硅谷的1980年代:群星闪耀时



今天OpenAI、Google和微软在定义基于大模型的“智能时代”。如果我们回到1976年PC诞生所构建的“信息时代”早期,那是Apple I诞生的时刻。这台电脑是由乔布斯和沃兹尼亚克在一个名为Homebrew Computer Club的极客社区中发布的,定价666美元。


当时的Apple I在极客社区里的发布,就好比今天新产品在Kickstarter发起线上众筹。这台电脑只面向极客用户,需要手动组装零件,早期销量不过200多台。但这款产品奠定了苹果的基石,帮助乔布斯和团队积累了第一批种子用户。


紧接着,苹果在1977年发布了Apple II,这一代产品不仅在外观上更为精致,增加了彩色显示,还加上了扩展插槽和一体化机箱,让极客们更容易扩展和DIY,其他核心规格其实没有太大变化。Apple II的发布是个里程碑,它定价1250美元,远低于当时价格高昂的商用计算机。


4年后,IBM的行动有些耐人寻味。据说IBM迫于市场压力,派出一个12人的精悍小团队,以行业老大的姿势,启动代号“Project Chess”的项目。作为当时的领军企业,自然需要掷地有声。他们推出了IBM PC。IBM PC基于Intel处理器,采用开放式硬件架构。


IBM这一举动毫无疑问是划时代的,定义了整个PC产业的开放标准,为所有其他厂商制造兼容设备打开了大门。从这个角度看,如今Facebook开放Oculus设计给第三方厂商,似乎也是相似的逻辑。


故事的另一面,IBM与微软的系统合作,也为后来事情的变化埋下了种子。如今互联网领域最重要的生态体系之一——Wintel生态(由Intel的芯片和Windows系统构成的)发端于此,但后来IBM在这个故事中逐渐“没了姓名”,我在下文接着展开。


再回到硅谷的1980年代,康懋达国际(Commodore International)也是一家值得关注的公司,虽然它没有走得很远。但在早期,它采用了几个关键策略。1982年,它以595美元,高性价比的定位,推出了康懋达64(Commodore 64)新款计算机。


这款产品具备当时领先的图形和音频处理能力,受到用户欢迎。同时,Commodore不止着眼美国,还优先开拓欧洲市场。依托欧洲当地的分销网络和广告投放,这家企业一度过半的收入来自欧洲,为其占领全球家用电脑市场奠定了坚实基础。


为什么苹果、IBM以及康懋达国际能够把个人电脑的价格“打下来”?


关键是芯片。毫无疑问,芯片是PC产品的基础,如同当下Nvidia以及云平台助推了OpenAI。PC产品的发展离不开芯片成本持续下降和“刚刚好的”算力。只有电脑做到适合用户使用而且价格合适,才有机会进入大众市场。


IBM PC最早采用的Intel的8088芯片就是个典型例子。8088相比前代 8086在总线位数上做了调整,成本因此得以下降,这也让它成了IBM PC 的核心芯片。



一个有趣的细节是,早年PC里的8位处理器,计算性能完全比不上现在的 ARM 处理器,和你家电冰箱或微波炉的显示器相当。也就是说,1980年的计算机,实际上就是你家电冰箱的计算水平。回头看,早期的电脑并没有大家想象中的那么强大,就为整个PC产业和互联网的发展奠定了基础。


其实,当时IBM主打的商用和军用计算设备非常庞大,算力也较强,但面对个人PC市场,或许没必要那么“硬核”,IBM选择了“降维打击”。8088则正好拉低了一个档次,带来了平衡的算力,同时成本也更低。8088芯片有点像今天的NAS,把商用服务器简化到更适合家用的算力和体积,让个人也能拥有小型计算解决方案。


如果说,今天英伟达的H200是商用的领导者,那AI PC或者AI NAS将模型带入各个计算终端的ASIC芯片会是谁在研发?我观察到,目前在AI芯片领域,峰瑞投资了一些企业,它们致力于研发下一代针对大模型场景的算力芯片。


在用户运营方面,就像今天围绕着大模型,在Reddit上有ChatGPT,LocalLLM,Stable Diffusion等一众子频道。每个时代的早期,大量杰出的人才和想法都源于线上线下社区。


这对今天的中国也没有那么陌生,因为早年的互联网进来的时候,也有很多大佬跑深圳,混迹于BBS里面,然后分散到各个产业里面。今天清华系的创业者们,围绕着大模型,也有类似属性的线上线下空间。


然而,重要且有趣的一件事是,这些社区会在长达 10 年的发展过程中逐渐消失。它们的“宿命”,是在创新活跃时极度繁荣,但等到行业成熟、巨头出现时,其热度逐渐消退。像Homebrew Club,包括今天的模型产业、3D 打印、四轴飞行器,都是这种“先兴后退”的模式。


系统的演进:每一代系统,都标榜自己“友好的交互界面”



芯片在硬件层面提升PC,操作系统则在软件层面重塑PC。


就像今天基本上只有算法工程师能“fine-tune”模型一样,大概在1979年,仅有万把硅谷工程师在捣鼓 DOS 系统(Disk Operating System,磁盘操作系统的缩写,是个人计算机上的一类操作系统)。那时DOS系统完全是基于代码命令行操作,还没有图形界面。彼时,操作系统还远远没有渗透到企业和大众用户的日常使用中。


直到1981年,随着IBM推出首代PC,DOS系统逐渐获得了更多的关注,但它仍然是不带GUI(图形界面操作系统)的命令行版本。所以,当时的计算场景跟现在的AI很像:需要大量技术极客和工程师反复调整、整合,才能做成具体的应用。


真正让PC和操作系统触达企业端的是施乐公司(Xerox)发布的“施乐之星”。这是世界上率先能实现商用的,拥有GUI的计算机。它有比特位屏幕、图形界面以及鼠标,并且可以访问电子邮件。GUI让PC迎来了第一波大众用户的增长。


1984年,苹果推出的GUI进一步将使用场景扩展到创意、教育等细分领域,让操作系统进一步向大众普及。


值得一提的是,在PC发展的头十年,DOS系统和GUI系统并存了很长时间,不少PC公司同时要维护两套系统,以满足不同场景的需求。DOS和GUI的目的是一致的,都是为了操作设备,但是面向的受众不同。前者以命令进行操作,但更轻量化,更针对专业用户,后者以图形界面进行操作,更大众化。


1980年的早期应用生态,今天我们眼中的“Killer App”



伴随着系统和电脑硬件能力的提升,早期应用逐渐发展起来。日渐丰富的应用,推动更多的企业与个人用户接触、购买电脑。我们来回顾下一些代表性应用,从中我们得以窥见,在PC生产力革命中,应用的渗透路径。


这些早期应用发端之时,市场尚未达到消费级规模,它们主要围绕生产力场景构建。


比如,最早在办公领域,1980 年,WordPerfect问世,类似于Microsoft Word,在早期主要应用于法律和学术领域。


紧接着在1982年,Lotus公司推出Lotus 1-2-3软件,加载在IBM PC中。Lotus 1-2-3是一款著名的电子表格软件,类似于我们现在使用的Excel。


Lotus 1-2-3问世两年后,Intuit公司推出的Quicken进一步优化了使用体验,拓展了更多应用场景。它改进了原有DOS系统的交互界面和可配置性,针对小型企业的财务管理需求进行深入开发。它切入了细分市场,拓展了场景纵深,错开了与后发者Excel的直接竞争。


在学术研究领域,相较于传统纸质文稿,使用PC协同修改、保存文稿,显著提高了用户的效率。在文件传输、邮件交流和文本编辑等场景中,PC在学术界的渗透率非常高。


1980 年代末,随着CPU算力和GUI处理能力的增强,软件开始对印刷、广告设计等行业产生重大影响,传统的设计流程(手工绘图和排版)开始向数字化转型。1989年,Corel公司发布了CorelDraw软件,这是首个结合矢量图形设计和桌面出版功能的软件。类似于后来的Photoshop,为用户提供了专业的图像处理功能,用于编辑出版,创造营销物料。


这些应用的早期定价相当高昂。例如,Lotus 1-2-3 的定价为495美元。根据世界银行数据,1982年美国人均国民总收入为1.42万美元,平均每月为1183美元,相当于买一款软件,要用掉半个月的收入。可以说,早期的软件主要面向具有强大付费能力的用户。


在生产力场景之外,一些面向娱乐场景的游戏软件逐渐发展。比如,1995年,《微软模拟飞行》这款游戏,让人们能够在家实现当飞行员的梦想,吸引了喜欢探索和尝试的用户。


可以看到,早期的PC生态由重度的生产力工具与一些有趣的游戏应用共同构建而成,从产业和学术研究场景起步,逐渐破圈。然而,这个过程非常漫长,因为底层的DOS和GUI技术发展比较缓慢。


这些早期应用所渗透的商业场景,也与当下的时代脉搏遥相呼应。或者说,当下的AI应用方向,与早期软件行业的发展路径如出一辙。比如,Google发布的NotebookLM让人眼前一亮,这是一款基于AI的笔记管理工具。我们也看到一些创业公司在做法务和财务知识库类的ToB AI应用。此外,AI游戏在这两年快速涌现,包括各种层出不穷的Chatbot、开放世界、游戏Agent、AI NPC等等。


类似地,就像早年应用的爆发受限于底层的DOS和GUI技术的发展进程,当下,虽然OpenAI发布了视频生成模型,但还未迅速应用于实际场景,一个原因是还要等待计算资源和GUI技术的成熟需要时间。因此,充分考虑不同技术发展要素可能出现的时机,显得至关重要。



总结1980年代的应用生态来看,Wordperfect与Lotus的表现可圈可点,Lotus抓住了窗口期,快速发展起来。Wordperfect交出了5年800万用户的成绩单。但是,微软和苹果花了近8年时间打磨操作系统,Windows Office问世,让这些应用的竞争出现了全新的态势。而另外一边,Quicken、CorelDRAW以及游戏类应用则各自在自己的用户群中以更慢的速度,逐渐发展起来。


“Killer App”案例:PC领域的“生态级玩家”——微软



微软是PC领域生态级的玩家,当我们梳理微软这家公司的发展脉络之后,可以发现他的崛起并非只源于产品力,而主要得益于出色的商业策略。


早在起步阶段,微软就展现出了敏锐的商业嗅觉。1980年,微软购买了名为86-DOS的第三方操作系统(是的,买来的)。这一举措使微软成为 IBM的重要合作伙伴。不过,微软迅速与其他硬件厂商展开合作,打破了与IBM的独家合作关系。


从80年代至90年代,微软经历了一些关键的发展节点。


1981年,微软发布MS-DOS 1.0。1983年,微软开始推出文本编辑软件,功能类似当时市场占主导地位的WordPerfect。这种 "以关键应用拉动系统销售" 的策略,一直伴随着微软。


1985年,微软发布Windows 1.0, 抓住了图形用户界面(GUI)增长的机遇。此后,微软一方面通过授权第三方来拓展Windows 1.0的市场,另一方面在1985年 开始向用户直接销售Windows 1.0。


彼时,Lotus公司推出的定价495美元的表格软件,已经占据超过一半的市场份额。所以我们不难理解,前微软CEO史蒂夫·鲍尔默在电视购物平台推广Windows 1.0时,反复强调:“我们的系统提供棋类游戏、电子表格和图像处理功能,只要99美元,不是500或600美元。”


微软需要同时维护DOS和Windows 1.0两套系统,在相当长的一段时间里,几乎无暇顾及应用层的开发。尽管如此,微软仍在持续成长。1989年,微软发布了Microsoft Office,占领了应用层的大量市场份额,为其后续的发展奠定了坚实的基础。


值得注意的是,Windows 1.0的发布比施乐的GUI系统整整晚了四年,这一定程度上反映出操作系统需要经历漫长的研发过程。早期的Windows在最初的两三年里,销量仅为上万台,但在其诞生后的8年内,累计出货量达到了五六百万台,增长曲线极为陡峭。


如果类比到当下,哪些AI应用会成为新的生态级玩家?MicrosoftAzure、OpenAI、iOS将以怎么样的角色,参与到AI时代的操作系统?哪些AI应用能够抓住发展的窗口期?大模型公司又会如何影响应用层的创新机会?对于这些问题,透过历史来,我们应该能够窥探一二。


新的交互方式,让电脑逐渐进入大众消费市场


尽管计算机技术起源于北美,有些欧洲发达国家早早通过海运引入了PC设备。


上文提到,早期PC主要聚焦于生产力场景。直到1989年,图像处理等应用开始涌现,才带动PC切入游戏等新使用场景。即便后来出现了对用户更友好的GUI系统,PC也一直未能大范围进入大众消费市场。PC真正进入普通家庭,是在1994年左右。随着互联网的兴起,以及网景浏览器的诞生,越来越多在公司使用电脑的人,开始在家中购置设备。


PC进入大众消费市场的过程中,一个值得一提的变量是人机交互方式的演变。新的技术要赢得消费级市场实现普及,往往离不开新的前端交互方式或设备。比如,鼠标的引入,构建了全新的人机交互模式,极大地增加了PC 的渗透和互联网技术的普及。比如,触屏这种交互方式在手机和移动互联网的普及过程中起了重要作用。


当下,新的LLM、Agent、多模态等技术走向大众市场可能也需要新的交互入口。由于芯片算力的提升,设备后端的处理能力更加强大,前端进一步往轻量化、便捷化的方向发展。未来的硬件可能会进一步减少对前端的依赖,用户在后端发出一个指令,设备就能自动完成任务。我留意到峰瑞也在关注类似AI/XR眼镜、AI耳机等各种各样的AI可穿戴设备。


在PC时代,技术产品的演进路径是从提高生产力的工具,到在消费级市场迎来爆发性增长。如今,信息传播速度飞快,AI是否能赋能更多的消费级场景,仍需时间验证。在早期阶段,我们可能仍然需要关注能够提高生产力的场景。除了大企业需求之外,全球持续增长的自由职业人群,会是软硬件新品服务的核心群体。


小结:影响早期硬件行业的“四个要素”



回顾了PC行业早期蓬勃发展的十年,我们可以总结出其发展脉络上的四大要素:芯片、系统、应用、终端。


首先是芯片,或者说存储和计算单元的演进。


自1980年代以来,虽然芯片和存储的成本有所下降,但难以显著降低,这与摩尔定律有关。简单来说,当旧制程的芯片成本降低了,人们又需要研发成本更高的先进制程芯片。


今天,人们为了应对海量数据存储的挑战,在云计算之外,部署了边缘计算,将部分数据分析功能放在终端。因此,降低AI推理芯片的成本,与此同时,推进以AI计算为底层逻辑的IDC基础设施,成为重中之重。


其次是操作系统。这个早期不起眼的中间件,其实承担了资源管理、设备适配等关键任务。在技术发展的长河里,我们已经看到了操作系统的长期爆发力,比如我们熟知的Windows、iOS系统。


再次是应用。早期的杀手级应用可以赚钱,但如果不切入到更纵深、垂直的场景中,最终可能被取代。通常应用层是在系统层之上的,那么,应用厂商能下沉到操作系统层吗?历史上,貌似只有Google实现了“半步”,将自己的应用集成到操作系统中销售。今天,什么样的AI应用会被模型公司吃掉,是AI应用创业者和投资人需要深思的问题。


最后,是作为交互载体的终端硬件产品,实现商业化价值。以PC为例,早期,人们购买的是PC这个硬件作为交互载体,但随着操作系统平台的建立,硬件本身的重要性相对降低。平台为王的时代,操作系统不仅创造了用户价值,也孕育了丰富的应用生态。这一现象在移动互联网时代也得到了验证。



1990年以后,一些我们更熟悉的故事



我们简单带过1990年后的故事。1990年代,我们迎来了英特尔奔腾处理器的发布、互联网应用的爆发、Windows 98的诞生、计算机外部设备连接标准USB 1.1,以及笔记本电脑的小型化与轻薄化,也就是我们常说的上网本和超极本。这一系列技术革新,指向了计算机发展脉络的不变趋势 —— 互联网真正走进了千家万户。


在这个时期,CPU进一步轻量化,USB 1.1的问世让外设的扩展更加便捷,鼠标等设备的连接也变得轻而易举。互联网的兴起,使得大规模的消费者开始使用个人计算设备。


值得注意的是,PC的发展揭示了一个明确的趋势:轻量化和便携性。



这里就不得不说到中国深圳的硬件行业发展。2000年初,当时有两拨人:一拨是来自中国台湾的组装厂,早期主要活跃于宁波和深圳;另一拨是在深圳本土组装PC的创业者,这也奠定了深圳作为消费硬件产业集群地的基础。与此同时,就像80年代硅谷的那些极客一样,一批中国极客开始打造、组装自己的电脑,这些人成为了PC的种子用户。


我曾与联想的朋友交流过,在他们市场渗透的初期,已经有了浏览器的存在,留给中国厂商的创新空间已经很少,各大厂商只好做些小的用户体验层的创新,但事实证明,也是非常有效的。联想通过开发简洁的拨号上网应用程序,极大程度降低了消费者联网的学习门槛,帮助他们迅速占领市场。随后,组装机逐渐退场,以联想为代表的品牌机的时代来临。耳熟能详包括:方正,清华同方和神州等品牌。


回顾PC的发展历程,不变的是:设备走向了便携化,越来越轻薄,人们可以随时随地进入数字世界;设备的功能从早期的生产力工具转向众多场景。那么,AI或者说大模型的应用会先在哪些垂直行业落地?AI的能力何时会实现泛化?这与背后的计算能力、设备形态、操作系统的成熟度都密切相关,它们是相互耦合的。


现如今,AI芯片等新变量,例如GPU、TPU 以及RISC-V,又推动了系统的演进,而系统的变化将穿透到应用层面。当时机成熟,端上爆发出许多有趣的AI原生应用,让本地的Copilot变得更加强大。然而,这其中的产业链要素非常多,需要我们深入思考,并观察关键玩家的变化。



什么让新硬件成立?专用设备 vs. 通用计算设备


在梳理PC领域发展的过程中,我意识到了一个非常有趣的问题:如今多种形态的AI硬件,可以与当年的PC发展做类比吗?哪些设备创新被PC吞噬了,哪些却没有?当时的PC如此强势,正如今天的手机、笔记本电脑和云计算。那么,哪些场景出现了专用设备与通用设备的分离,而非被一个大一统的设备通吃?


一定会被提到响亮的名字是,任天堂!1983年,任天堂推出第三世代游戏机,实际上这款游戏机使用的芯片与苹果一代、二代完全相同,但它却成为了一个专用设备。直到今天,索尼公司出品的PS5、微软研发的Xbox依然在硬件领域占领一席之地,也是相同的道理。因此,当垂直场景在计算需求、系统需求、用户需求、交互方式等方面有足够的深度时,就有机会形成独立的专用设备品类。


摩托罗拉于1999年发布的PDA也是如此。虽然它使用相对滞后的低算力硬件,但却满足了个人数字助理的需求。当时的PDA只是一个低成本的信息管理工具,可以记录日程和联系人,价格比PC低很多。PDA在便携设备的发展历程中曾占据了一个独特的小生态位,没有被PC吞并,并且可被视为手机的前身。



二、今天的AI硬件与应用,以及新机遇


回到当下,虽然产业链要素发生了变化,但不变的是人们对数据获取、生产和传播的需求。在抽象层面上,人们的需求从通过GUI操作,转向智能化的代理(Agent)直接完成任务。


有了Copilot,创作者可以输入一些上下文,让机器帮助他们获取创意脚本,或了解同行在做的产品。企业可以通过一个Agent,实时追踪行业相关的所有创新动态,自动生成每周报告。


这些获取、生产数据的方式,将变得更聪明。而这种载体一定与传统PC不同,它可能是一个始终在线、实时运算的计算设备。过去,人们需要通过鼠标和GUI操作来提高生产力;而当人工智能直接被嵌入计算设备时,它可以独立采取行动。这意味着,人机交互方式可以不依托鼠标和显示屏。你可以发送一个任务,人工智能就能直接完成。这些变化会催生新的硬件交互形态。


而这一切将如何实现,我们也能从过去40年的PC发展史里找到一些答案中看到一条脉络。因为,这些底层的场景诉求具有一致性。GPT驱动的新生产力变革,早期大概率会聚焦能提升生产力的场景,犹如Dos时期的Lotus 123。如果我们试着结合之前提到的游戏产业、图像处理产业,以及生产、获取、传播数据的方法,理论上能发现许多新的应用场景。



新的生产要素,如何影响硬件创业?


AI大模型的出现,让四要素发生了变化。在芯片层面,GPU、TPU等芯片让算力不断提升;在系统层面,大模型可能会逐渐与系统融为一体;在终端层面,用户与设备交互产生的私有化数据会更有价值;前三个要素的变化,也会催生出新的应用。我们或许会见证一种全新的存算一体的计算设备的诞生。未来,它的地位可能与手机、笔记本,甚至公有云都有所不同。我试图用一张表来清晰地罗列出它的特点。



从生产力场景起步,不同的速度渗透进入各场景。


  • 大模型与新操作系统:大模型是智能化的发动机,它很可能将和操作系统融为一体。如今微软推出的云计算服务平台Azure的增长,Windows的动作以及OpenAI探索AppStore模式,都在表现出不同玩家争夺新系统身位的早期态势。


  • GPU或者ASIC算力:在1980年代,Intel是硬件领域的佼佼者,当下,NVIDIA风头正盛。GPU和大模型的专用计算设备正在变得智能化,我非常看好ASIC芯片(Application Specific Integrated Circuit,一种为专门目的而设计的集成电路,而非通用芯片)和NPU。这些设备如果快速迭代,可能会在2030年之前催生新应用。


  • 私有化数据:数据依然是新石油。对于AI而言,独特的组织内部或专有的高质量数据资源,或机器获取的私有化数据,是训练和生成的关键资产。


  • AI应用:从行业发展回顾中,我们可以看到应用不是独立于系统和硬件存在的,而是研发者基于系统和硬件现状,对于场景价值的挖掘与探索。成功的关键在于对系统和硬件载体能力的理解,对用户的理解,以及对时机的把握。



信息技术一直朝着便携的方向前进,这是人们长期的需求,比如,我们的电脑从没法移动的PC变成了随身携带的电子笔记本。然而,设备要想实现便携性,它的计算能力和续航就会受限,进而限制其能够运行的模型智力水平。当前手机能够运行的模型参数通常在3B参数级别。相较之下,私有云能够运行的模型参数在数十B级别,公有云则在百B级别。


这意味着,当Windows或者下一代安卓系统准备就绪时,它们可能会以3B级别的模型和Copilot作为基础,启发新一代的AI应用,例如AI驱动的浏览器、邮件回复Agent、AI办公软件、AI收藏夹、文档检索总结Agent等。这是手机和笔记本必然会经历的阶段,因为从硅基工艺角度来看,每瓦特的AI算力不会快速发生巨大的变化。


另一方面,则是基于公有云的超级人工智能。在过去10年云计算的高速发展中,云已经成为公认最有价值的AI核心基础设施。但云已经暴露出自己的问题:AI时代,每个人和组织,是否愿意将自己所有的数据交给一家AI公司?或者说你是否愿意将淘宝、微信和资金账户的访问权限全部交给单一的厂商?这显然是个巨大的心理成本。一个可能的方向是,云开始在最顶层发挥作用,厂商通过API调用方式来发送任务,在这个过程中,AI通过强大的模型能力,来为厂商提供相应的数据。


在AI应用和公有云这两者之间,出现了构建全新系统和硬件的机会。这种操作系统或许能像一个智能代理,运行在24小时通电的设备上。你可以通过手机或笔记本向它发送任务,它会在后台自动执行。它拥有巨大的数据存储容量,且由于没有算力限制,可以配备百瓦级的GPU,提供约200 TOPS 的AI算力,以确保足够聪明。具体而言,它可能是一台私有云设备,所有数据都在本地,服务于家庭和小型组织的存储与计算需求。


新设备可能最先触达的用户:创作者、工程师与知识工作者


这种新设备会以什么样的形态出现呢?目前讨论得比较多的是AI眼镜、AI耳机,我认为,极有可能出现一种始于生产力,提升进而拓展为消费级的个人计算设备,它甚至是存算一体的。


基于这些判断,我创立了冰鲸科技。2021年,我们的第一款私有云产品开始在海外众筹网站发布,吸引了极客人群的关注。通过访谈和调研,我发现,不只是极客工程师群体,创作者与知识工作者群体,也有大量数据资产的管理需求,需要生产力工具来解决他们在存储和协作方面的痛点。这与早期PC的渗透路径类似,瞄准那些愿意付费、对生产力有强烈需求的用户,切入全新的战场。


再次回到我们在前面讲到的始于硬件,兴于应用,终于生态。对我们来说亦然。硬件是起点,但应用才能带来更大价值。我相信开放的生态,社区化的运营方式,能够帮助我们更早地吸纳涌现出来的各种应用,就像硅谷早期的极客社区那样。


1980年的硅谷vs.今天的中国:AI计算时代,中国的结构性机会


可以预见,未来十年,在信息设备领域,大概率是软硬件混合的结构性创新。这对创业公司的入场门槛有较高的要求。我认为,在这个方向,将有机会诞生出非常独特、有趣的由中国公司引领的创新。无论是AI NAS还是AI PC(人工智能个人计算机),我并不认为硅谷会继续主导这一轮创新。由于产业链能力的弱化,硬件迭代速度在美国呈指数级下滑。


正如硅谷知名投资人彼得·蒂尔所说:我们已经很久不知道如何投资硬件了。这确实是美国的现状,也是中国的窗口期机遇。在当下其实可以毫不夸张地说,全球找不到任何一个地方比中国珠三角更适合硬件产品的孵化。毫无疑问,中国的长产业链所带来的创新效应将会延续。


除了产业链基础,在软硬件混合的领域,还中国还有出色的工程师供给,中国在AI硬件和AI端侧的创新潜力正在形成共识。作为这个方向的从业者,希望能跟更多人一起开启这段摘星之旅。也希望之前提到的操作系统、应用、计算和模型等创新要素,能对大家的投资决策和创业实践有所启发。


三、投资人说


非常感谢潘总深入的洞察和思考。我个人看到目前市场上的AI硬件主要包括以下四种:



正如前文潘总所讲,整体而言,垂直领域的AI硬件创新,需要找到合适的场景做纵深,才能避免被手机、PC等产品形态所吞掉。短期内,手机与PC的生态位是难以撼动的,大模型的使用也正逐渐成为明牌,那么,AI硬件创新最关键的是找到合适的场景,深刻理解用户需求,做出足够深厚的中间层,设计出好的产品并提供极致的体验。从这个角度来看,AI+硬件,很大程度上本质是AI应用,硬件本身则更接近一个容器/载体。


在AI可穿戴设备方向,今年AI PIN在北美一度很火。这款产品提供了接打电话、网络搜索、智能语音助手等功能,但随着产品的交付,问题逐渐显现。其实这个产品形态的挑战很大,因为大多数消费者很难理解一个没有“锚点”的全新产品。所谓“锚点”,是在消费者心中已经有认知的东西。比如一款AI耳机,或者AI自行车,消费者会拿这个新产品和他心目中的锚点产品的平均指标进行对比。


首先,这个新产品不能低于行业标准水平的90%,然后才会关注附加的创新功能。而AI PIN是一个没有锚点的产品形态,消费者比较难接受。


今年我们看了大量的AI可穿戴产品,其中以AI眼镜、AI耳机为主。我发现一些创业者把眼镜的功能堆得特别丰富,但是忽略了眼镜本身最核心的指标之一是舒适性和时尚性。一般来说,无框或细框的普通光学眼镜,重量大约在 15 克到 30 克之间,但现在的AI眼镜往往较重,想象一下一个人每天长时间戴着60g以上重量的眼镜,那肯定非常难受。


要把AI眼镜做得足够轻便,同时能承载一些新功能,这就对产品的整体结构提出了非常高的要求,而且要在续航、摄像头、显示这三者之间做权衡取舍,当然这取决于你想以什么样的多模态进行交互,这背后需要综合考虑产品的重量、材料(舒适度)、时尚性(可插拔模块化)、近视匹配方案、续航、手机互联等多个方面。


具体到AI功能层面,首先“唤醒”是一个在用户体验层面非常重要,但非常难解决的点。在目前的软硬件技术条件下,要在ToC的产品上实现无感的唤醒(不说唤醒词、不按实体按键)并且自动工作,是非常难的。这意味着你的Agent要持续识别环境要素,同时要有效理解你的意图,并实时判断它需要调取什么样的任务处理功能。


唤醒的下一层,则是具体的AI任务功能层面。单纯加一个大模型的端口,然后把所有任务直接丢给大模型,并不能有效解决问题。关键可能在于找到合适的场景,深耕这个场景所需要的AI能力,然后打造出好的产品。如果选择办公场景,那可能要先把翻译、转写这些基础功能做好,如果你关注的是户外运动场景,那么运动指标分析、智能导航、拍摄记录等功能或许更重要。此外,针对旅行博主的AI产品和针对视听障碍人士的AI产品,在生成内容的形态上一定差异巨大。当然,以上功能的最终收口是成本。


除了AI可穿戴产品,今年我看的比较多的是AI陪伴类产品,可进一步细分为成人情感陪伴和儿童陪学陪玩。对于做成人情感陪伴AI硬件,最挑战的是,在Character.ai类软件陪伴产品已经开始赢得市场的情况下,找到独立硬件存在的合理性和必要性。也就是需要回答,到底某个场景下,硬件能带来升级的感官体验。


儿童AI陪学陪玩是一个非常有潜力,但是非常难做的市场。第一,由于一些家长会限制儿童看电子屏幕的时长,天然就造就了独立硬件的机会。第二,中国双职工家庭占比非常高,父母陪伴孩子的时间有限,面向儿童的高质量的陪伴,以及寓教于乐的教育辅助也是确定性的刚需。


然而,挑战也是非常明确的。比如,儿童注意力较为分散,即使面对再好玩的东西,大多数儿童的注意力也很难持续超过半小时。再比如,儿童的语言组织与表达与成年人不同,一旦大模型没有充分理解儿童的意思,开始“打岔”,儿童会迅速失去耐心。此外,陪学的功能听起来fancy,但是,一旦儿童发现这不是玩具,是用来学习的,可能会有一定的排斥心理。总之,一款硬件产品很难满足儿童长期的需求。


此外,在这种情况下,提供高质量的内容非常重要,包括引入儿童喜爱的IP和剧情,把故事、游戏等元素有效的结合或许是个思路。此外,针对模型的训练也很重要,要能够让模型更有效地理解儿童的意思,才能进一步有效交互。当然,安全因素也是儿童类产品需要重点考虑的。


从更长期的角度来看,如果未来所有儿童玩具都有对话和运动能力,下一步拼什么?比如,近几年非常知名的AI玩偶LOVOT提供了一个思路。最初其核心差异化特色是动作表情交互,随着技术的发展,当其他产品也能做动作表情,LOVOT开始从卖功能转向卖IP。


此外,第四类AI硬件产品是具备一定泛化能力的家庭机器人,目前在这个方向上的突破不多,更多是集中在识别能力的以及针对corner case的处理上。短期来看,这类产品受制于成本价格,没有办法使用算力较高的芯片;长期来看,具身智能的实现还有很长的路要走。欢迎感兴趣的朋友,阅读《具身智能 vs. 运动科技:一个让机器像人,一个把人变成机器?| 峰瑞报告》


以上是我对AI硬件的一些思考。


文章来自于微信公众号 “峰瑞资本”,作者“潘鑫磊”


AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

2
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT