华为改进Transformer架构!盘古-π解决特征缺陷问题,同规模性能超LLaMA
华为改进Transformer架构!盘古-π解决特征缺陷问题,同规模性能超LLaMA华为盘古系列,带来架构层面上新!量子位获悉,华为诺亚方舟实验室等联合推出新型大语言模型架构:盘古-π。
来自主题: AI资讯
5740 点击 2024-01-02 14:34
华为盘古系列,带来架构层面上新!量子位获悉,华为诺亚方舟实验室等联合推出新型大语言模型架构:盘古-π。
近日,来自华为诺亚方舟实验室、北京大学等机构的研究者提出了盘古 π 的网络架构,尝试来构建更高效的大模型架构。