摘要
本发明提供一种人工智能芯片及其归约方法。人工智能芯片包括多个计算核以及归约单元。多个计算核的每一个进行本地归约操作而生成本地归约数据。归约单元耦接至多个计算核。归约单元对多个计算核的本地归约数据依数值大小进行排序。归约单元基于排序的结果对多个计算核的本地归约数据进行全局归约操作以生成全局归约数据。举例来说,归约单元对这些本地归约数据中的第一最大浮点数与第二最大浮点数进行累加,以及归约单元对这些本地归约数据中的第一最小浮点数与第二最小浮点数进行累加。基于先排序再进行全局归约操作,归约单元极大保留了数据累加精度。