面向AI PC布局三大战略重点,四大架构满足不同场景AI需求。
芯东西3月21日报道,下午,在中国北京举办的AMD AI PC创新峰会上,AMD董事会主席及CEO苏姿丰(Lisa Su)现身。
正值英伟达前几天刚推出最强AI芯片GB200,苏姿丰此次现身同样将炮口对准AI,秀出了AMD大举布局AI PC的肌肉。
苏姿丰说,AI不仅是一项很酷的技术,还是计算的未来,并且是过去50年来最具变革性的技术,这可能比互联网的引入更为重要。
轻量级大模型PC端部署已经成为一大趋势。AMD在去年12月发布了代号为“Hawk Point”的APU AMD锐龙8040系列,比第一代性能提升60%;苏姿丰宣布,目前,这一系列芯片已经出货,且AMD锐龙AI PC出货量已经达到数百万台。
AI PC的风口涌现,峰会上,AMD的重要合作伙伴联想也宣布,第一款AI PC将于4月18日在联想科技创新大会上发布。
与此同时,在现场AMD还联合伙伴大秀AI PC四大功能Demo,这也是生成式AI技术落地部署的常见场景,包括文生图、图生图、代码生成和聊天机器人对话。
在技术方面,为了提升AI PC的性能,AMD利用了三种计算引擎:基于“Zen”架构的CPU,基于AMD RDNA 的集成或独立GPU,以及基于AMD XDNA的AI引擎NPU,能满足对于延迟、计算、功耗等有不同需求的AI应用。
今天,AI的潜力在每一次对话中开始爆发。苏姿丰认为,AI的不同之处在于,该技术的采用率更快,现在AI技术正在触及并改变人们的生活方式。
AMD关注的是,智能终端设备作为承载AI强大力量的重要载体之一,每天都会被人们广泛使用,因此它需要为每个AI应用提供相应的AI引擎。
为了将这项技术推向市场,芯片厂商需要为每个应用提供合适的计算引擎。当审视整个生态系统时,AMD看到的是在整个基础设施中提供AI的机会,包括云、数据中心、下一代AI PC、下一代嵌入式设备等。
在这背后,AMD的三个战略重点分别是,首先为广泛多样的训练和推理计算引擎组合,包括CPU、GPU、NPU;其次是开放和成熟的软件功能,有一个开放、经过验证、对开发人员友好的软件平台;第三个是AI创新生态,苏姿丰谈道,没有一家公司可以满足整个市场的需求。因此,必须多个企业相互合作,才能实现创新并将AI解决方法推向市场。
AMD的AI硬件产品组合和软件功能会为每个市场提供不同的解决方案。如基础模型需要最大的GPU和CPU,大模型部署时用于微调的解决方案,在PC、工作站中对于AI推理更为重要的CPU,其次还有面向机器人、汽车、智慧城市等嵌入式应用的解决方案。
因此,无论是千亿参数规模以上的大模型,还是PC上的数十亿参数规模的模型,AMD都提供了合适的计算引擎。
苏姿丰说,她对AI PC感到非常兴奋。AI PC是一个全新的设备类别,她看到了将PC转变为真正最智能和最个性化设备的能力。
当下,想要实现AI PC能力的提升,就需要新的技术,苏姿丰谈道,AMD正在将CPU路线图、GPU路线图和新的NPU技术创新结合在一起。
苏姿丰谈道,几年前,AMD就意识到打造AI PC需要添加另一个计算引擎,就是NPU。
去年,AMD推出锐龙7040系列,这是第一个集成NPU的x86处理器,目前市场上已经有数百万台锐龙AI PC出货。
除硬件外,AI PC还有很多的协作体验。AI PC可以帮助用户实时记录会议和自动总结,PC可成为一个高效个人助理,用户可以使用自然语言搜索文件、邮件等。
此外,AMD与微软合作实现了NPU驱动的Windows 11工作室效果的规模化应用。
硬件方面,今年初,AMD推出了Ryzen 8040系列移动处理器的首批产品,代号是Hawk Point。
与AMD合作将近20年的联想,同样面临以大模型为代表的AI技术大潮,联想去年推出AI for All战略,将在AI内嵌的智能终端、AI导向的基础设施、AI原生的方案服务三大领域投入研发,并打造关键性的技术和产品。
在联想看来,AI PC作为AI内嵌在智能终端领域的核心产品,是AI普惠的首选终端。
回顾PC发展的历史,当下这一产业迎来第三次代际升级。第一次是家用电脑诞生、第二次是互联网与电脑融合、第三次是今天,AI的技术爆发式成长,电脑有望成为真正意义上像人脑一样思考的个人助理。
联想定义了AI PC的五大特征,分别是:内嵌基于个人大模型、自然交互的个人智能体;内嵌个人知识库;全面标配CPU+GPU+NPU的本地混合AI算力;连接开放的AI应用生态;保护个人隐私及数据安全。
其中,内嵌在本地的个人大模型,可以在离线状态完成任务,与本地知识库集成,针对用户个人风格生成个性化内容。
AMD和联想将在共同研发、共建生态两个方面,探索更高性能、创新形态的产品,基于硬件平台,汇聚上下游合作伙伴,打造AI PC产业生态。
联想集团执行副总裁兼中国区总裁刘军预告,第一款具备五大特征的AI PC将于4月18日联想科技创新大会上发布。
苏姿丰还谈到了AMD在中国的发展情况,AMD目前有4000多名工程师在中国工作,打造了软件管理、平台解决方案。在中国已经有多个大型公司采用AMD E处理器为内部基础设施供电。
AMD在中国建立了AI卓越中心,负责AI工程和客户支持。此外,AMD还在和清华大学等顶尖高效进行AI研究。
AMD高级副总裁、GPU技术与工程研发王启尚介绍了AMD AI技术发展报告。
大型的闭源模型正超过摩尔定律实现指数级增长,但较小的开源模型针对边缘端、终端设备的任务,在总结、翻译、问答的任务上更为出色,且能保证安全、隐私性,并显著降低成本,与此同时,开源模型还更容易和更多社区开发者共同实现技术创新。
针对于在边缘端、终端的大模型,AMD要对不同平台进行不同优化,例如训练基础模型往往需要上万片甚至更多GPU,因此需要满足算力、内存和网络的可扩展性,而边缘的嵌入式应用,如汽车紧急制动、传感器融合对于低延时处理有特定需求,对AI PC终端设备每瓦算力、低功耗更为重要。
因此,为了满足广泛的AI需求,AMD从云、边缘到终端开发了4种不同架构,Zen主要用于通用处理和AI推理,CDNA用于HPC、AI训练与密集推理,RDNA用于游戏和基于AI的内容开发,XDNA聚焦于低功耗、一直在线的AI推理需求。
其中,Zen、RDNA、XDNA一起构成了Ryzen AI的基础。
Zen的CPU核心路线图中,每一代都坚持性能、能效提升,王启尚透露,将提供更高性能和效率的Zen 5,按计划将于今年推出。
Zen 4的单线程性能提升超过15%,并且基于AVX-512指令集,Zen 4可以以更节能的方式加速AI推理,添加BF16模型,相比FP32的2倍性能提升。
相比RDNA 2,RDNA 3针对游戏和AI实现了代际性能提升,在游戏领域提供了1.5倍每瓦性能,1.8倍的光追性能,整体游戏性能提升1.4倍。这一AI架构使得AI加速器数量增加一倍,提供了高达2.3倍的峰值AI性能。
XDNA NPU架构聚焦于边缘端和终端的AI推理应用,主要针对每瓦性能和能效的优化,这些性能也是AI PC最关注的问题。
锐龙8040系列APU能够保持低功耗的同时有性能优势。针对下一代XDNA 2,AMD的目标是持续集中提高每瓦性能,能在低功耗、不影响电池续航的情况下执行更复杂的AI任务。
XDNA的Adaptive dataflow(自适应数据流结构)解决了生成式AI的一大主要挑战,就是昂贵的内存和带宽。基于Adaptive dataflow架构,XDNA可以将左侧深度神经网络映射到右侧的Custom dataflow(数据流架构)中,从而提高性能和能效。
XDNA另一个优势是空间分区架构,这一架构支持多重任务处理,系统可以同时执行4个AI工作负载。
另一方面,软件是将性能发挥出来的关键,Ryzen AI软件的前端工具可以优化基于Pytorch模型,的后端工具能够根据每个架构独特的优势进一步优化。Ryzen AI软件可以实现跨CPU、GPU、NPU的最佳性能。
开发者可以用始智AI等开源社区提供的预训练模型进行选择,然后对其进行优化,以提高对应目标硬件的效率,基于API部署到开发者软件上。
Ryzen AI软件简化了从安装到部署的开发周期,让开发AI应用更加快速,且响应速度更快。
AMD的合作伙伴开源模型社区始智AI创始人刘道全谈道,60%的大模型应用基于开源大模型来做,开源社区就成为了这个生态的基础设施,基于这样的背景,去年9月,该公司上线wisemodel社区。目前,该平台上已经有400多个基础模型,年底预计模型总数达到数千个。
始智AI平台上已经有大量模型与AMD GPU实现适配。开源社区在这之中扮演的角色就是,往下打通算力,往上支撑大模型应用,让AI更简单。
AMD高级副总裁、计算与图形总经理Jack Huynh谈道,AMD正在将新的AI体验带入PC。
AMD锐龙8040系列采用Zen 4、AMD RDNA 3和AMD XDNA架构,实现了1.6倍的AI性能提升,可以提供16TOPS NPU算力和39TOPS的整体算力,能满足AI的需求。
在中国,为了实现广泛的新兴AI体验,AMD正在推动芯片之外的创新,包括一个开放的端到端的软件生态系统,使其ISV合作伙伴能够利用数千个AI模型。到2024年底,AMD按计划将推动超过150个ISV为Ryzen AI进行开发。
华硕电脑全球副总裁石文宏谈道,AI PC更好结合了本地和云端的AI算力,能大幅提升用户的效率,必然会引起整个PC产业的新变革。上个月,华硕发布了搭载AI助手“华硕a豆”的系列笔记本,可以为用户提供AI服务和应用。
Huynh现场演示了AI PC上的生成式AI Demo。
文生图演示中,输入提示词“长城、秋天”等,并随后针对性修改不同提示词,包括季节、图像风格等。
图生图演示中,AI PC可以根据左侧用户实时画的内容,对右侧内容同步修改完善图片。
AI PC还能运行代码生成。
可以看到,在生成代码时,模型部署在NPU上,可以最大限度延长电池的使用时长。
AI PC现场展示了通义千问的能力,可以快速生成答案。
毫无疑问,AI PC已经成为众多科技公司发力的主要方向之一,包括AMD等PC芯片厂商在内。从AMD的技术路线布局来看,其一定程度上已经完成了从硬件到软件操作系统的铺垫,并加速PC终端厂商打造AI PC新品。
AI PC风口来临,PC厂商都在瞄准这一机会,这无疑会在PC产业引发一波新的换机潮,或许会推动更多具有创新应用或者面向更丰富场景的AI PC技术、产品、生态出现。
本文来自微信公众号“芯东西”(ID:aichip001),作者:程茜,编辑:李水青
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0