AI资讯新闻榜单内容搜索-微调

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 微调
符尧:别卷大模型训练了,来卷数据吧!【干货十足】

符尧:别卷大模型训练了,来卷数据吧!【干货十足】

符尧:别卷大模型训练了,来卷数据吧!【干货十足】

今天分享一篇符尧大佬的一篇数据工程(Data Engineering)的文章,解释了speed of grokking指标是什么,分析了数据工程

来自主题: AI资讯
8121 点击    2024-01-02 11:13
告别冷启动,LoRA成为大模型「氮气加速器」,提速高达300%

告别冷启动,LoRA成为大模型「氮气加速器」,提速高达300%

告别冷启动,LoRA成为大模型「氮气加速器」,提速高达300%

如果 AI 是一辆豪华跑车,那么 LoRA 微调技术就是让它加速的涡轮增压器。LoRA 强大到什么地步?它可以让模型的处理速度提升 300%。还记得 LCM-LoRA 的惊艳表现吗?其他模型的十步,它只需要一步就能达到相媲美的效果。

来自主题: AI技术研报
7388 点击    2024-01-01 11:14
多模态大模型学杂了能力反下降?新研究:MoE+通用专家解决冲突

多模态大模型学杂了能力反下降?新研究:MoE+通用专家解决冲突

多模态大模型学杂了能力反下降?新研究:MoE+通用专家解决冲突

多模态大模型做“多任务指令微调”,大模型可能会“学得多错得多”,因为不同任务之间的冲突,导致泛化能力下降。

来自主题: AI资讯
3870 点击    2023-12-30 14:39
向量数据库凉了吗?

向量数据库凉了吗?

向量数据库凉了吗?

向量存储检索是个真需求,然而专用向量数据库已经凉了。

来自主题: AI资讯
5577 点击    2023-12-30 14:32
一套参数,狂揽160个SOTA!厦大等重磅开源「视觉感知基础模型」APE

一套参数,狂揽160个SOTA!厦大等重磅开源「视觉感知基础模型」APE

一套参数,狂揽160个SOTA!厦大等重磅开源「视觉感知基础模型」APE

由厦门大学等机构提出的全新视觉感知基础模型APE,只需一个模型外加一套参数,就能在160个测试集上取得当前SOTA或极具竞争力的结果。而且训练和推理代码以及模型权重全部开源,无需微调,开箱即用。

来自主题: AI资讯
9711 点击    2023-12-11 20:40