解密PC的AI进化：AI大模型如何“压”进PC？

9573点击 2024-01-14 11:49

当地时间2024年1月9日，2024年国际消费电子展(CES 2024)在美国拉斯维加斯举办。AI for All成为CES大会的关键议题之一。在众多展品当中，被视作个人大模型普惠第一终端的AI PC吸引众多目光。全球最大的PC厂商联想集团更是推出了包括Yoga Pro 9i，ThinkBook Plus Gen 5 Hybrid、全球首款商务AI PC ThinkPad X1 Carbon AI、ThinkCentre neo Ultra在内的AI PC产品。那么这些初次登场的AI PC产品身上到底有什么黑科技呢？虎嗅与您一起走进2024CES，为您揭开AI PC神秘的面纱。

奔驰、宝马、大众纷纷把大语言模型接入车机系统，给让人能跟汽车自然对话。

三星给冰箱装了个AI识别系统，可以识别食物品种和新鲜度。

LG推出了会问候早安、欢迎回家的家庭AI机器人。

在2024年的CES展上， AI热度仍在持续，各家厂商都在喊AI for All，All in AI之类的口号。

然而对于普通的消费电子用户来说，更关注的似乎还是停留在手边的设备，比如作为我们生产力工具的电脑。

AI PC是2024年CES展中最热的词之一，在数据中心业务上赚的盆满钵满的英伟达，也在本次展会上推出了多款聚焦个人、商用电脑的AI硬件产品和应用。包括RTX 4060 Super、RTX 4070 Ti Super 和 RTX 4080 Super三款GPU，将大语言模型（LLM）的处理速度提升了5倍，将AI视频生成速度提高了150%。

英伟达产品管理的高级总监Justin Walker在新闻发布会上强调：“我们已经销售了超过1亿块RTX GPU，这为运行AI应用的个人电脑提供了坚实的硬件基础。”

在PC终端方面，微软在CES大会之前，就宣布将在新款Windows 11电脑上配备Copilot按钮，这是一个专门用于调用现已融入其操作系统的人工智能聊天机器人的功能。配备Copilot按钮的首批设备预计将在本月完成上市。值得注意的是，Windows PC键盘布局上次的重大变革还是在30年前。

不过，在AI PC方面走的最靠前的当属联想。从2023年10月的全球TechWorld大会宣布了全线AI PC规划后，仅几个月时间，联想就带着多款AI Ready阶段的AI PC产品亮相CES展。包括赋能创作过程的Yoga Pro 9i，全球第一台可无缝切换笔记本电脑和平板电脑两种模式的ThinkBook Plus Gen 5 Hybrid、全球首款商务AI PC ThinkPad X1 Carbon AI、新一代超小型ThinkCentre neo Ultra等。

解密PC的AI进化：AI大模型如何“压”进PC？

无论是AI技术发展，还是PC市场趋势，都预示着AI将会成为2024年的PC行业新的增长引擎。AI PC则成为了传统PC厂商的新增长机会，甚至有可能打破依靠供应链和渠道驱动的业务模式，创造出全新的PC市场趋势和发展模式。

技术大揭秘：把AI装进PC

大模型的通用性、泛化能力都是来自于模型的参数量，从AI大模型热潮爆发至今，模型的参数量不断扩大，对算力的需求也在直线上涨。由此AI需要云端算力，几乎成了业界共识，很多人认为脱离了云服务器的AI PC很难把模型的能力发挥好。

然而，对于个人和商业用户来说，纯粹的云端AI也并不是万能的。随着AI技术的发展和应用场景的多样化，依赖云端AI处理大量数据、提供服务的模式正逐步显现出局限性。

目前的AI云服务主要面临三个比较明显的挑战：成本、安全和响应速度。

而结合云端AI和AI PC类产品的优势，构建的云端+本地的AI模式，很可能会成为未来AI的发展趋势。通过这种模式，大型AI模型可以在云端进行复杂的数据分析和学习，而端侧AI则负责实时、低延迟的任务处理。这种协同工作模式不仅能够弥补单一模式的不足，还可以在保证处理效率的同时，确保用户数据的隐私和安全。

解密PC的AI进化：AI大模型如何“压”进PC？

那么，要把云端那些需要英伟达A100、H100显卡才能跑起来的AI大模型，“拖到”小小的个人电脑中，应该怎么做呢？

联想的做法是对大模型进行“压缩”。

AI大模型通常涉及复杂的数据结构（如神经网络的权重矩阵）。这些结构需要频繁地在计算过程中修改和访问，所以在训练和推理过程中需要占用大量内存空间。

以GPT-3为例，它有1750亿个参数。通常情况下，这些参数以32位浮点数（即float32）的形式存储。在32位浮点数中，每个参数需要4字节的存储空间。换算成更常见的单位，这大概相当于700GB。

目前参数量较小的主流AI大模型多位70亿参数或130亿参数，这些“小”模型需要的存储空间，大约也要20GB以上。个人、办公电脑上要运行这些模型，相当困难。

“我们现在做的技术就是如何把这个存储的这些空间降低之后，还能保持原有的模型性能。”联想研究院研究员谢栋介绍说。

联想基于阿里通义千问的7B模型重新做了一个新的模型，在参数量不变的情况下对模型的“体积“进行了大幅度的压缩，谢栋告诉虎嗅：”可能原来一个参数用两个字节来存储，经过压缩，一个参数只有半个字节就可以存储。“

阿里通义千问7B模型的原始大小是14.4GB，在联想的Lenovo AI now中运行的模型则压缩到了4GB。由此，AI大模型+电脑本身的缓存，大概只要5-6G内存就能运行起来。而目前，联想的主流集成显卡笔记本电脑内存都在16G以上，独立显卡的游戏本、高性能本显存都在8G以上，可以轻松运行压缩后的通义千问7B模型。

解密PC的AI进化：AI大模型如何“压”进PC？

现在的AI与传统的软件不一样，不是所有的芯片都能跑。AI与硬件之间还有一个中间层叫framework。目前，联想的AI PC正在做的事就是定制自己的framework。

“中间层是决定他能在这样的硬件基础上跑的，第一要能跑，第二还要跑得好。“联想全球中小企业产品与解决方案总经理郑爱国告诉虎嗅，目前我们的专家每天都在和AMD和Intel的专家沟通，对他们最新的平台和芯片一个一个地调优，是其能最大限度地适合AI PC的工作和任务。

目前联想研究院在这个“中间层”的研发工作中担任重要角色，除此之外，联想对AI PC的研发采用了多元化布局。目前最主要的研发任务主要集中在中国和美国。在日本、巴西，以及印度也都有研发分布。联想集团董事长兼CEO杨元庆表示：“创新还有研发一直以来都是联想两个重要的核心能力之一。我们的研发经费在过去几年一直在提升，从不到3%到大概已经4%以上。”

如何用AI PC打出区隔

正在拉斯维加斯举办的2024 CES展上，联想展出了ThinkBook 16P、ThinkPad P1、ThinkPad P16、ThinkBook 13x等多款AI Ready的产品。这些产品的推出，不仅是技术进步的展示，也是联想在AI PC领域策略的体现。

联想集团执行副总裁兼中国区总裁刘军表示：“我们的AI PC目前处在AI Ready的阶段，在2024年4月的联想中国创新科技大会（TechWorld）上，我们将正式宣布我们的个人Agent。”这一声明表明，联想正将AI PC技术与个人助理功能结合，推动AI技术在个人电脑领域的深入应用。

在AI PC的硬件方面，联想计划推出CPU+GPU+NPU的混合AI模式，这种模式可以提高计算效率，优化AI应用的性能。NPU（神经网络计算单元）的引入是对传统CPU和GPU功能的补充，能够更加专注于处理AI相关的任务。这种混合硬件布局不仅适用于PC，也将应用于手机、平板等多种设备，甚至扩展到商业环境和AIOT（AI驱动的IoT）产品。

在软件生态方面，联想的战略是改变传统PC行业甚至是消费电子产品的交互逻辑，从应用交互转向意图交互。这一转变预示着未来的交互方式将更加直观和自然。用户不再需要通过复杂的菜单和步骤来执行任务，而是可以直接通过意图来与设备互动。这种基于意图的交互方式能够大大提高用户体验，使设备更加智能和易用。

在探索这些新领域的同时，对于其他厂商而言，如何在AI PC市场中寻找自己的定位和特色，是一个值得思考的问题。例如，其他厂商可能会在特定的垂直领域内进行深耕，如专注于创意工作的AI应用，或者在安全性、隐私保护方面进行创新。同时，不同厂商可能会选择不同的技术路径或合作伙伴，以寻找差异化的市场机会。

对于整个PC行业来说，AI PC的发展是一个多维度的过程，涉及硬件、软件、用户体验和生态系统等多个层面。联想作为先行者，在AI PC方向上自然会占据一定的先发优势，不过在创新产品的开发，以及AI技术的发展过程中，势必也会遇到各种不确定的问题。

解密PC的AI进化：AI大模型如何“压”进PC？

从行业趋势来看，AI PC的未来可能不仅仅局限于个人电脑，而是会扩展到整个智能终端生态系统，包括智能家居、智能汽车等领域。这种趋势下，厂商之间的竞争将不仅仅是硬件和软件的竞争，更是对整个生态系统的理解和布局的竞争。

PC市场的拐点

IDC在2023年底发布的《全球季度个人计算设备跟踪报告》指出，鉴于当前的经济环境和市场状况，对全球PC市场的预测被下调。预计2023年的出货量将比2022年下降13.8%，而2022年的出货量则比上年下降了16.6%。这种连续两年的两位数同比下降在个人电脑市场是前所未有的。不过这种“衰退”趋势可能正在为市场的后续复苏铺平道路。

IDC认为，疫情期间售出的PC产品大多将在2024年面临Windows更新周期。此外，一些失去微软服务支持的旧版Windows系统，将面临2024年升级至Windows 11的压力。

这些因素在短期将会促进2024年PC市场的增长。而从长远来看，PC市场更大的增长动力则很可能源自AI PC带来的革命性升级。

联想智能设备集团执行副总裁兼总裁Luca Rossi在CES期间接受采访时表示：“2023年市场确实遭遇了一些压力。对于2024年全球市场的趋势我们保持谨慎乐观的态度，预见会有少量的增长。我们也乐观地认为，在2024年下半年和2025年，AI PC将在消费和商用市场掀起广泛的换机潮。人工智能电脑将成为转折点，加速更换周期。”

虽然目前全球PC市场中，仅有联想一家在大举落地AI PC，但其它PC行业巨头也都在对AI PC概念保持高度关注。HP和Dell的高管在近期的采访中都表示AI PC必将大幅提升PC的升级换代潜力表示肯定，HP Personal Systems部门总裁Alex Cho认为：AI PC或有望帮助PC行业增长率翻倍。

尽管面临短期挑战，IDC预计2024年及以后的市场将会出现反弹。预计2024年PC市场总量将比2023年增长3.4%，这得益于AI PC对市场升级起到的催化作用。初步针对企业PC市场的某些细分市场，随着用例的进一步发展和成本的降低，AI PC可能会推动更广泛的市场应用。

同时，IDC认为2024年将是PC市场的关键一年，为市场近期的挑战提供了喘息机会。预计2024年之后，出货量的增长将超过大流行前的水平，在2027年达到2.85亿台的峰值。

文章来自于虎嗅 “齐健”，作者 “齐健”

解密PC的AI进化：AI大模型如何“压”进PC？

关键词: AI PC , PC大模型 , AI电脑

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

逆向大模型

【开源免费】kimi-free-api是一个提供长文本大模型逆向API的开渔免费技术。它支持高速流式输出、智能体对话、联网搜索、长文档解读、图像OCR、多轮对话，零配置部署，多路token支持，自动清理会话痕迹等原大模型支持的相关功能。
项目地址：https://github.com/LLM-Red-Team/kimi-free-api?tab=readme-ov-file