AI资讯新闻榜单内容搜索-微调

符尧：别卷大模型训练了，来卷数据吧！【干货十足】

今天分享一篇符尧大佬的一篇数据工程（Data Engineering）的文章，解释了speed of grokking指标是什么，分析了数据工程

来自主题: AI资讯

8121 点击 2024-01-02 11:13

告别冷启动，LoRA成为大模型「氮气加速器」，提速高达300%

如果 AI 是一辆豪华跑车，那么 LoRA 微调技术就是让它加速的涡轮增压器。LoRA 强大到什么地步？它可以让模型的处理速度提升 300%。还记得 LCM-LoRA 的惊艳表现吗？其他模型的十步，它只需要一步就能达到相媲美的效果。

来自主题: AI技术研报

7388 点击 2024-01-01 11:14

多模态大模型学杂了能力反下降？新研究：MoE+通用专家解决冲突

多模态大模型做“多任务指令微调”，大模型可能会“学得多错得多”，因为不同任务之间的冲突，导致泛化能力下降。

来自主题: AI资讯

3870 点击 2023-12-30 14:39

向量数据库凉了吗？

向量存储检索是个真需求，然而专用向量数据库已经凉了。

来自主题: AI资讯

5577 点击 2023-12-30 14:32

GPT-4 API曝出重大漏洞！15个样本微调，一句prompt秒生恶意代码供出私人信息

即便是GPT-4 API「灰盒」也逃不过安全漏洞。FAR AI实验室的团队从微调、函数调用、搜索增强三个方向入手，成功让GPT-4越狱。

来自主题: AI资讯

8706 点击 2023-12-27 15:07

大模型微调非得依赖人类数据吗？DeepMind：用带反馈的自训练更好

面对当前微调大模型主要依赖人类生成数据的普遍做法，谷歌 DeepMind 探索出了一种减少这种依赖的更高效方法。

来自主题: AI资讯

9073 点击 2023-12-26 15:02

开源+共训，双轮驱动基础大模型创新普惠｜浪潮信息吴韶华@MEET2024

相比GPT-3，GPT-4 （包括GPT-3.5）的能力有了非常巨大的进步。这背后其实得益于一个很重要的过程引入：微调。

来自主题: AI资讯

5183 点击 2023-12-21 14:42

一套参数，狂揽160个SOTA！厦大等重磅开源「视觉感知基础模型」APE

由厦门大学等机构提出的全新视觉感知基础模型APE，只需一个模型外加一套参数，就能在160个测试集上取得当前SOTA或极具竞争力的结果。而且训练和推理代码以及模型权重全部开源，无需微调，开箱即用。

来自主题: AI资讯

9711 点击 2023-12-11 20:40

像调鸡尾酒一样调制多技能大模型，智源等机构发布LM-Cocktail模型治理策略

随着大模型技术的发展与落地，「模型治理」已经成为了目前受到重点关注的命题。只不过，在实践中，研究者往往感受到多重挑战。

来自主题: AI资讯

4745 点击 2023-12-11 16:25

0微调搞定160个测试集！最强多模态分割一切大模型来了，架构参数全开源

用多模态大模型来做语义分割，效果有多好？一张图+文字输入想分割的物体，大模型几秒钟就能识别并搞定！

来自主题: AI资讯

10643 点击 2023-12-10 14:56

AI资讯新闻榜单内容搜索-微调

符尧：别卷大模型训练了，来卷数据吧！【干货十足】

告别冷启动，LoRA成为大模型「氮气加速器」，提速高达300%

多模态大模型学杂了能力反下降？新研究：MoE+通用专家解决冲突

向量数据库凉了吗？

GPT-4 API曝出重大漏洞！15个样本微调，一句prompt秒生恶意代码供出私人信息

大模型微调非得依赖人类数据吗？DeepMind：用带反馈的自训练更好

开源+共训，双轮驱动基础大模型创新普惠 ｜浪潮信息吴韶华@MEET2024

一套参数，狂揽160个SOTA！厦大等重磅开源「视觉感知基础模型」APE

像调鸡尾酒一样调制多技能大模型，智源等机构发布LM-Cocktail模型治理策略

0微调搞定160个测试集！最强多模态分割一切大模型来了，架构参数全开源

开源+共训，双轮驱动基础大模型创新普惠｜浪潮信息吴韶华@MEET2024