AI框架是AI算法模型设计、训练和验证的一套标准接口、特性库和工具包,集成了算法的封装、数据的调用以及计算资源的使用,同时面向开发者提供了开发界面和高效的执行平台,是现阶段AI算法开发的必备工具。
当前,人工智能基础性算法理论研究创新日益活跃,深度神经网络日趋成熟,各大厂商纷纷投入到深度神经网络算法的工程实现并发力建设算法模型工具,进一步将其封装为软件框架供开发者使用,这个过程中AI框架(业界也称AI开发框架、深度学习框架等)应运而生。AI框架负责给开发者提供构建神经网络模型的数学操作,把复杂的数学表达转换成计算机可识别的计算图,自动对神经网络进行训练,得到一个神经网络模型用于解决机器学习中分类、回归的问题,实现目标分类、语音识别等应用场景。
2、产业链剖析:上游为软硬件工具,下游为算法公司
中国AI框架产业的上游涵盖数据、硬件工具、软件工具,其中硬件工具主要包括高性能GPU、CPU、存储器、分布式计算环境以及NPU等硬件加速器,软件工具则有编程语言与开发工具、操作系统、深度学习库、并行计算库与持续集成工具等;中游是AI框架的开发;下游则是为工业制造、金融、能源电力、交通等领域开发人工智能算法的算法公司。
中国AI框架产业上游的硬件企业包括GPU/CPU厂商英伟达、AMD、英特尔、景嘉微、海光信息,存储器厂商三星、SK海力士、长江存储等,分布式计算环境厂商戴尔、惠普、IBM等,NPU厂商华为、谷歌等;软件企业包括编程语言编程语言与开发工具厂商Oracle,操作系统厂商微软、苹果等,并行计算库厂商如英伟达、Khronos等;中游AI框架开发公司主要包括谷歌、Meta、华为、百度、一流科技、旷视科技等;下游则有科大讯飞、海康威视、第四范式等AI算法公司。
结合人工智能的发展历程和AI框架的技术特性来看,AI框架的发展大致可以分为四个阶段,分别为萌芽阶段(2000年初期)、成长阶段(2012~2014年)、稳定阶段(2015年~2019年)、深化阶段(2020年以后)。其发展脉络与人工智能,特别是神经网络技术的异峰突起有非常紧密的联系。
在萌芽阶段,AI框架并不完善,开发者不得不进行大量基础的工作,例如手写反向传播、搭建网络结构、自行设计优化器等;在成长阶段,AI框架体系已经初步形成,声明式风格和命令式风格为之后的AI框架趟出了两条不同的发展道路;在稳定阶段,AI框架迎来了繁荣,而在不断发展的基础上,各种框架不断迭代,也被开发者自然选择。
如今正处于AI框架的深化阶段,随着人工智能的进一步发展,新的趋势不断涌现,例如超大规模模型的出现(GPT-3等),向AI框架提出了更高的要求。随着人工智能应用场景的扩展以及与更多领域交叉融合进程的加快,越来越多的需求被提出,如对全场景多任务的支持、对高算力的需求等,这就要求AI框架最大化的实现编译优化,更好地利用算力、调动算力,充分发挥硬件资源的潜力。此外,人工智能与社会伦理的痛点问题也促使可信赖人工智能在框架层面的进步。基于以上背景,现有的流行框架都在探索下一代AI框架的发展方向,如2020年华为推出昇思MindSpore,在全场景协同、可信赖方面有一定的突破;旷视推出天元MegEngine,在训练推理一体化方面深度布局。在这一阶段,AI框架正向着全场景支持、超大规模AI、安全可信等技术特性深化探索,不断实现新的突破。
2017年,国务院发布《新一代人工智能发展规划》,提出建设布局人工智能创新平台,强化对人工智能研发应用的基础支撑。其中,人工智能开源软硬件基础平台重点建设支持知识推理、概率统计、深度学习等人工智能范式的统一计算框架平台,形成促进人工智能软件、硬件和智能云之间相互协同的生态链。
科技企业与顶尖高校对AI框架的发展成熟贡献最为活跃。数字科技企业巨头与顶尖高校是AI框架发展壮大的主体维护力量,打造技术产业生态、营造学术创新氛围,是两大主体的源动力。个人及开源组织也扮演着重要的角色,是AI框架创新性、公益性的重要体现。
从全球主流AI框架在GitHub上的数据情况来看,TensorFlow的各项指标在AI框架中都是名列前茅的,并且和第二名的差距非常大,是全球目前活跃度最高、应用最广的AI框架。在排行榜中的第二名是PyTorch,近几年在学术领域的表现比较亮眼,有很大的发展潜力,但总体而言,与TensorFlow有些差距,且在开源项目活跃程度上已被国内华为研发的Mindspore赶超。
注:①查询日期为2023年8月1日;②开源代码提交的次数(Commits)表征开源项目活跃度;③代码复刻、分叉(Fork),表征开源项目被引用情况;④点赞数(Star)表征开源项目关注度;⑤贡献者(Contributors)表征开源项目贡献者规模。
根据技术所处环节及定位,当前主流AI框架的核心技术可分为基础层、组件层和生态层。
基础层实现AI框架最基础核心的功能,具体包括编程开发、编译优化以及硬件使能三个子层。编程开发层是开发者与AI框架互动的窗口,为开发者提供构建AI模型的API接口。编译优化层是AI框架的关键部分,负责完成AI模型的编译优化并调度硬件资源完成计算。硬件使能层是AI框架与AI算力硬件对接的通道,帮助开发者屏蔽底层硬件技术细节。
组件层主要提供AI模型生命周期的可配置高阶功能组件,实现细分领域性能的优化提升,包括编译优化组件、科学计算组件、安全可信组件、工具组件等,对人工智能模型开发人员可见。
生态层主要面向应用服务,用以支持基于AI框架开发的各种人工智能模型的应用、维护和改进,对于开发人员和应用人员均可见。
全球来看,国际主流AI框架由Google、Meta等科技巨头主导。目前以Google、Meta、Amazon、Microsoft等代表的互联网科技巨头,凭借自身的数据、技术和资本等优势,持续在AI框架生态领域发力,引领全球AI框架技术创新升级趋势,并逐步形成了以Google-TensorFlow和Meta-PyTorch为代表的双寡头格局。从市场占有情况看,产业界以TensorFlow为主,学术界以PyTorch为主。
展望未来,AI框架将注重前端便捷性与后端高效性的统一,AI框架将支持端边云全场景跨平台设备部。另外,随着处理任务的复杂化、处理数据的密集化,跨架构的开发能力将会成为常态化的需求。AI框架需要与硬件基础设施平台充分解耦,通过标准的硬件注册接口实现跨设备平台的快速部署。
更多本行业研究分析详见前瞻产业研究院《中国人工智能行业发展前景预测与投资战略规划分析报告》。
文章转载自”前瞻经济学人APP“