阿里通义发布并行计算新策略:1.6B等效4.4B,内存消耗骤降95% 阿里通义发布并行计算新策略:1.6B等效4.4B,内存消耗骤降95% 关键词: AI,PARSCALE,模型训练,人工智能 既能提升模型能力,又不显著增加内存和时间成本,LLM第三种Scaling Law被提出了。 来自主题: AI技术研报 6868 点击 2025-05-28 14:21