AI资讯新闻榜单内容搜索-微调

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 微调
四行代码让大模型上下文暴增3倍,羊驼Mistral都适用

四行代码让大模型上下文暴增3倍,羊驼Mistral都适用

四行代码让大模型上下文暴增3倍,羊驼Mistral都适用

无需微调,只要四行代码就能让大模型窗口长度暴增,最高可增加3倍!而且是“即插即用”,理论上可以适配任意大模型,目前已在Mistral和Llama2上试验成功。

来自主题: AI资讯
7832 点击    2024-01-08 14:33
看见这张图没有,你就照着画:谷歌图像生成AI掌握多模态指令

看见这张图没有,你就照着画:谷歌图像生成AI掌握多模态指令

看见这张图没有,你就照着画:谷歌图像生成AI掌握多模态指令

谷歌新设计的一种图像生成模型已经能做到这一点了!通过引入指令微调技术,多模态大模型可以根据文本指令描述的目标和多张参考图像准确生成新图像,效果堪比 PS 大神抓着你的手助你 P 图。

来自主题: AI技术研报
3021 点击    2024-01-06 16:42
当LLM学会左右互搏,基础模型或将迎来集体进化

当LLM学会左右互搏,基础模型或将迎来集体进化

当LLM学会左右互搏,基础模型或将迎来集体进化

进入现今的大模型 (LLM) 时代,又有研究者发现了左右互搏的精妙用法!近日,加利福尼亚大学洛杉矶分校的顾全全团队提出了一种新方法 SPIN(Self-Play Fine-Tuning),可不使用额外微调数据,仅靠自我博弈就能大幅提升 LLM 的能力。

来自主题: AI资讯
9193 点击    2024-01-06 12:17
大模型套壳祛魅

大模型套壳祛魅

大模型套壳祛魅

本文探讨了大模型套壳的问题,解释了大模型的内核和预训练过程。同时,介绍了“原创派”和“模仿派”两种预训练框架的差异,并讨论了通过“偷”聊天模型数据进行微调的现象。最后,提出了把“壳”做厚才是竞争力的观点。

来自主题: AI资讯
6276 点击    2024-01-04 09:53
5000字干货总结:探索AI在B端产品中的应用

5000字干货总结:探索AI在B端产品中的应用

5000字干货总结:探索AI在B端产品中的应用

随着AI的发展,其应用场景也越来越广泛。在这样的背景下,面向企业的B端产品同样迎来了转型升级的机遇。本文将阐述AI在B端产品中的应用,希望对你有所帮助。

来自主题: AI资讯
7122 点击    2024-01-03 16:12
符尧:别卷大模型训练了,来卷数据吧!【干货十足】

符尧:别卷大模型训练了,来卷数据吧!【干货十足】

符尧:别卷大模型训练了,来卷数据吧!【干货十足】

今天分享一篇符尧大佬的一篇数据工程(Data Engineering)的文章,解释了speed of grokking指标是什么,分析了数据工程

来自主题: AI资讯
7730 点击    2024-01-02 11:13
告别冷启动,LoRA成为大模型「氮气加速器」,提速高达300%

告别冷启动,LoRA成为大模型「氮气加速器」,提速高达300%

告别冷启动,LoRA成为大模型「氮气加速器」,提速高达300%

如果 AI 是一辆豪华跑车,那么 LoRA 微调技术就是让它加速的涡轮增压器。LoRA 强大到什么地步?它可以让模型的处理速度提升 300%。还记得 LCM-LoRA 的惊艳表现吗?其他模型的十步,它只需要一步就能达到相媲美的效果。

来自主题: AI技术研报
7082 点击    2024-01-01 11:14
多模态大模型学杂了能力反下降?新研究:MoE+通用专家解决冲突

多模态大模型学杂了能力反下降?新研究:MoE+通用专家解决冲突

多模态大模型学杂了能力反下降?新研究:MoE+通用专家解决冲突

多模态大模型做“多任务指令微调”,大模型可能会“学得多错得多”,因为不同任务之间的冲突,导致泛化能力下降。

来自主题: AI资讯
3607 点击    2023-12-30 14:39
向量数据库凉了吗?

向量数据库凉了吗?

向量数据库凉了吗?

向量存储检索是个真需求,然而专用向量数据库已经凉了。

来自主题: AI资讯
5276 点击    2023-12-30 14:32