英特尔:CPU的痛就像送外卖

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
英特尔:CPU的痛就像送外卖
7209点击    2026-04-20 14:05

英特尔,真是越来越会玩了——


因为它把优化CPU这件事的痛点,直接搞得像送外卖似的:


英特尔:CPU的痛就像送外卖

△英特尔市场部同学友情出演


在这个有趣的视频中,我们看到了“CPU的痛点”和“送外卖”之间的联系:


  • 外卖送错:缓存未命中,送错了就白跑;
  • 用“猜”的方式送餐:分支预测失败,先猜一步,猜错就得重来;
  • 等餐超时:前端阻塞,不是我慢,是前面环节没跟上;
  • 爬楼梯送餐:微架构热点,不是没路可走,是都堵在一条路上。


形象是归形象,但,何以解“优”?


芯片老玩家英特尔给出的,是自己发明的一项技术——二进制优化(IBOT)


简单来说,IBOT采用了一种在内存内动态优化代码的方式,动态去扫描CPU程序的核心卡点,然后通过指令替换的方式把那些产生卡点的指令替换成解决性能卡点的指令,从而提升整体性能。


更直观一点的,用没用IBOT的CPU,就像下面的俄罗斯方块:


英特尔:CPU的痛就像送外卖


左边是没有经过优化的处理器的运行情况,可以看到很多不规则的形状堆砌起来之后产生很多的空隙区,称之为“CPU运行气泡”,在每个气泡中CPU其实在空转,不能产生实际运行效果。


右边就是重新码整齐之后的俄罗斯方块,它把很多气泡挤了出来,让空隙区更少,CPU执行效率会更高。


如此优化,到底有什么直接的作用呢?


答案是,和你用笔记本打游戏,息息相关。


CPU升级,还发了个AI高静本Plus


除了IBOT在软件层面上进行优化之外,这次英特尔在硬件上也有一个升级动作——


英特尔® 酷睿™ Ultra 200HX Plus。


英特尔:CPU的痛就像送外卖


架构层面上,本次200HX Plus重点强化Uncore游戏性能,通过提升晶粒间(D2D)频率900MHz至3GHz,突破Arrow Lake多Chiplet架构通信瓶颈。


这使得游戏平均帧率更高,1% Low帧率表现更稳定,确保游戏画面更丝滑、运行更流畅。


英特尔:CPU的痛就像送外卖


而我们刚才提到的IBOT,以《永劫无间》为例,游戏性能直接提升了19%


英特尔:CPU的痛就像送外卖


更直接的,英特尔基于架构和软件层面的优化,让游戏本的体验也更上了一层楼。


英特尔:CPU的痛就像送外卖


首先是性能方面,现在你的游戏本,即便开启的是高静模式,游戏体验和性能也和开启狂暴模式无异。


在现场,左右两台笔记本在玩《黑神话悟空》时体感几乎看不出来差异的情况下,散热发出的声音完全是两个level:


英特尔:CPU的痛就像送外卖

△左:高静模式;右:狂暴模式。


听感方面,AI高静游戏本Plus的噪音标准进一步压低到43dB以下,让游戏本在杂乱的环境下也能有很好的体验。


同样是在现场,英特尔便展示了43dB和50多dB情况下体感的差异,来感受一下这个feel:


英特尔:CPU的痛就像送外卖


除此之外,触感也是影响游戏体验的一大关键,因为有些游戏本玩着玩着就会出现键盘发烫的情况。


但在AI高静游戏本Plus这里,掌托等核心接触区温度是可以长时间控制在40°C以下的。


英特尔:CPU的痛就像送外卖


可以看到,红外枪展示扫出来的核心接触器,温度都控制下来了;而45°C以上区域,甚至是可以把三文鱼的表皮给热熟的……


并且在续航方面,AI高静游戏本Plus现在可以续航时间提升至7小时以上!


因此整体来看,通过从底层CPU架构和软件的优化,英特尔已经把游戏体验这事拔到了一个新高度。


英特尔DCG老大:Agentic AI让CPU重回舞台中央


英特尔除了在酷睿有新动作之外,这几天数据中心方面,亦是如此——


去年新上任的英特尔公司执行副总裁兼数据中心事业部(DCG)总经理,Kevork Kechichian(下文简称KK),来北京了!


英特尔:CPU的痛就像送外卖

△Kevork Kechichian


量子位有幸和KK,从Agentic AI、产品与路线、竞争、生态、组织文化、供应链等方面进行了一场深度对话。


上任仅9个月,KK给出的英特尔数据中心转型答案,和酷睿Ultra 200HX Plus的优化逻辑如出一辙:挤掉算力气泡,拒绝纸面参数,用真实落地解决行业痛点。


Agentic AI时代,CPU正在强势回归


眼下大模型行业最火的概念莫过于Agentic AI。当行业从单纯的对话推理,走向需要Agent去真正执行复杂任务、提升生产力时,算力的需求结构也发生了微妙的变化。


KK在交流中直言不讳地表示这对英特尔来说是一个极其利好的转变。


他指出,在早期的基础模型推理中,CPU与GPU的占比很低。但随着Agentic AI的爆发,一个调度核心可能需要触发成百上千个Agent,无论是串行还是并行处理,都需要强大的调度与编排能力,因此,CPU的使用率正在成倍激增。


KK还预测说:


我的预测是,未来CPU与GPU的比例将达到1:1。


在这种趋势下,英特尔在数据中心领域积累了近三十年的企业级工作负载经验,瞬间成为了最核心的护城河。面对Agentic AI流水线,英特尔的思路非常明确:


针对小于1000亿参数的模型,直接利用至强(Xeon)内置的AMX等向量引擎就能高效搞定,根本不需要昂贵的独立加速器;而对于更大规模的模型,英特尔也在积极规划多层级的GPU和其他AI加速器产品线。


在这个过程中,英特尔吸取了过去“硬件很强但软件难用”的教训。现在的首要任务是对开发者绝对友好。不用再让几百个工程师花半年时间去适配框架,英特尔的底层库已经做好了准备,让算力的部署变得几乎透明。


上任9个月的“杀伐果断”


算力底座的逻辑理顺了,但如何保证英特尔这头大象能轻快起舞?这就要谈到KK上任这9个月以来的硬核操作了。


当我刚接手时,团队告诉我有很多决策卡点。我的第一反应是,这些烂摊子不能留。


KK的动作堪称雷厉风行。在上任不到60天的时间里,他直接砍掉了3个备受业界关注的平台项目。原因很简单:


在研判了路线图和竞争力后,KK发现这些产品如果能提前6个季度发布会是好产品,但放在当前的节点,它们已经失去了时间上的竞争力。与其让合作伙伴投入数亿美元去陪跑一个没有竞争力的平台,不如快刀斩乱麻。


砍掉旧项目的同时,KK对现有的路线图按下了加速键,将下一代产品的进度提前了1到2个季度。


同时,他把目光死死盯住了优化二字。


当客户反馈在竞品平台上跑出的数据更好时,KK立刻调动软件团队,跑到客户的真实业务环境里去做针对性优化。


不要总去描绘未来,先把现有的解决方案优化到极致,这是我们目前战略的基石。


谈竞争与生态


如今的数据中心市场可谓群狼环伺,英伟达和Arm都在大举进军CPU领域。面对多出来的竞争对手,KK显得非常从容,甚至觉得这是一种赞美。KK一针见血地指出:


大家都开始做类似至强的架构,说明我们坚持了三十年的方向是对的。


英特尔:CPU的痛就像送外卖


英特尔的核心优势在于几十年积累的软件层和基础设施经验。数据中心追求的是极限的稳定性和正常运行时间(Uptime),英特尔的系统是在成千上万个节点的真实业务数据中打磨出来的,而很多跨界的新玩家,目前还只能依赖于合成数据进行测试。


在谈及和谷歌的合作时,KK也重申了这一点:谷歌在TPU上取得了巨大成功,但他们依然选择加深与英特尔的合作,定制化IPU,这本身就是对英特尔x86架构作为数据中心基石地位的再次印证。


而在推理时代,芯片公司最深的护城河到底是什么?


KK给出的答案非常务实:无缝部署的能力。


当你建好数据中心,按下开关的那一刻,客户能不能立刻开始产生效益?如果我有一个4000亿参数的模型,换上新硬件后,能不能在24小时内跑通所有优化库?这才是真正的护城河。


并且KK给整个生态吃下了一颗定心丸:“虽然我们在提供系统级的解决方案,但英特尔永远不会与我们的客户竞争。这是底线。”


找回工程师文化


面对外界“英特尔需要重拾伟大工程师文化”的呼声,本身就是技术背景出身的KK给出了他的三剂良药:


  1. 顶层架构师的视野:确保资深的技术大牛(Fellow和架构师)来定义必须要做的事。
  2. 极度的紧迫感:产品不仅要在功能上对齐,在价格和上市时间上必须做到极致的“按时交付”。
  3. 消灭多任务:这是KK带来的最大改变之一。“没有人能真正做到多任务处理,那只会浪费时间和焦点。”现在,英特尔内部的项目,都必须由一群“除了这个项目什么都不用想”的人来专职推进。


KK在交流的最后坦言:


我可以坐在这里跟你聊上几个小时的战略和技术,但真正的证明,只能是我们把产品实打实地交付出来。


正如英特尔内部现在最明确的口号:2026年,是交付之年(Year of Delivery)。


文章来自于"量子位",作者 "金磊"。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

2
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI