AI资讯新闻榜单内容搜索-微调

比LoRA还快50%的微调方法来了！一张3090性能超越全参调优，UIUC联合LMFlow团队提出LISA

2022 年底，随着 ChatGPT 的爆火，人类正式进入了大模型时代。然而，训练大模型需要的时空消耗依然居高不下，给大模型的普及和发展带来了巨大困难。面对这一挑战，原先在计算机视觉领域流行的 LoRA 技术成功转型大模型 [1][2]，带来了接近 2 倍的时间加速和理论最高 8 倍的空间压缩，将微调技术带进千家万户。

来自主题: AI技术研报

9854 点击 2024-04-01 15:45

只要千元级，人人可用百亿级多模态大模型！国产「AI模盒」秒级训练推理

【新智元导读】从今天起，千元级就能解锁专属大模型了！这款搭载首颗纯国产14nm Chiplet大模型推理芯片的「深目」AI模盒，可以轻松实现百亿级参数多模态大模型的推理+微调。各种碎片化长尾算法，直接秒级生成！

来自主题: AI技术研报

8413 点击 2024-03-29 16:03

全球最强开源模型一夜易主，1320亿参数推理飙升2倍！

【新智元导读】就在刚刚，全球最强开源大模型王座易主，创业公司Databricks发布的DBRX，超越了Llama 2、Mixtral和Grok-1。MoE又立大功！这个过程只用了2个月，1000万美元，和3100块H100。

来自主题: AI技术研报

9611 点击 2024-03-28 16:09

开源大模型王座再易主，1320亿参数DBRX上线，基础、微调模型都有

这是迄今为止最强大的开源大语言模型，超越了 Llama 2、Mistral 和马斯克刚刚开源的 Grok-1。

来自主题: AI技术研报

11358 点击 2024-03-28 14:26

如何从头开始编写LoRA代码，这有一份教程

作者表示：在各种有效的 LLM 微调方法中，LoRA 仍然是他的首选。LoRA（Low-Rank Adaptation）作为一种用于微调 LLM（大语言模型）的流行技术，最初由来自微软的研究人员在论文《 LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE MODELS 》中提出。

来自主题: AI技术研报

7896 点击 2024-03-20 16:16