苹果官宣：在谷歌TPU上训练其AI模型

7002点击 2024-07-30 11:43

苹果官宣：在谷歌TPU上训练其AI模型

公开文件显示，苹果开发自家的人工智能（AI）系统Apple Intelligence离不开谷歌定制芯片的支持。

美东时间7月29日周一，苹果官网公布了一篇技术论文，详细介绍为支持苹果个人智能化系统Apple Intelligence而开发了一些基础语言模型，包括一个用于在设备上高效运行的约30亿参数模型——端侧“苹果基础模型”（AFM），以及一个为苹果云端AI架构“私有云计算”（Private Cloud Compute）而设计的大型服务器语言模型——服务器AFM。

论文中，苹果介绍，端侧AFM和服务器AFM是苹果开发的生成式模型大家族成员，这些模型都用于支持用户和开发者。论文中，苹果披露，训练模型采用了谷歌研发的第四代AI ASIC芯片TPUv4和更新一代的芯片TPUv5。文章写道：

“我们在8192块TPUv4 芯片上从无到有训练服务器AFM，使用4096的序列长度和4096个序列的批量大小，进行6.3万亿token训练。”

“端侧AFM在2048块TPUv5p芯片上进行训练。”

在这篇长达47页的论文中，苹果没有提到谷歌或是英伟达的名字，但表示，其AFM和AFM服务是在“云TPU集群”上训练。这意味着，苹果向云服务商租用了服务器执行计算。

事实上，今年6月的全球开发者大会（WWDC）期间，媒体已经在苹果公布的技术文件细节中发现，谷歌成为苹果在AI领域发力的另一位赢家。苹果的工程师在构建基础模型时运用了公司自研的框架软件及多种硬件，包括仅在谷歌云上可用的张量处理单元（TPU）。只不过，苹果未透露，相比英伟达等其他AI硬件供应商，苹果有多依赖谷歌的芯片和软件。

因此，本周一在社交媒体X上有评论指出，6月就出过苹果用谷歌芯片的消息，现在我们有了更多关于训练堆栈的细节。

苹果官宣：在谷歌TPU上训练其AI模型