LoRA数学编程任务不敌全量微调 | 哥大&Databricks新研究 关键词: LoRA,微调,模型训练,Llama2,监督微调 大数据巨头Databricks与哥伦比亚大学最新研究发现,在数学和编程任务上,LoRA干不过全量微调。 来自主题: AI技术研报 1474 点击 2024-05-20 21:03
符尧:别卷大模型训练了,来卷数据吧!【干货十足】 关键词: 大模型,预训练,监督微调 今天分享一篇符尧大佬的一篇数据工程(Data Engineering)的文章,解释了speed of grokking指标是什么,分析了数据工程 来自主题: AI资讯 6894 点击 2024-01-02 11:13