
Kimi开源又放大招!20秒更新万亿参数的中间件来了
Kimi开源又放大招!20秒更新万亿参数的中间件来了Kimi开源又双叒放大招了!
来自主题: AI技术研报
6962 点击 2025-09-11 19:43
Kimi开源又双叒放大招了!
训练代码、中间 checkpoint、训练日志和训练数据都已经开源。
伴随大模型迭代速度越来越快,训练集群规模越来越大,高频率的软硬件故障已经成为阻碍训练效率进一步提高的痛点,检查点(Checkpoint)系统在训练过程中负责状态的存储和恢复,已经成为克服训练故障、保障训练进度和提高训练效率的关键。