AI资讯新闻榜单内容搜索-微调

谁才是最强的？清华给海内外知名大模型做了场综合能力评测

在 2023 年的 “百模大战” 中，众多实践者推出了各类模型，这些模型有的是原创的，有的是针对开源模型进行微调的；有些是通用的，有些则是行业特定的。如何能合理地评价这些模型的能力，成为关键问题。

来自主题: AI技术研报

7711 点击 2024-04-19 11:29

OpenAI日本办事处成立，定制「日语版GPT-4」发布！

OpenAI，去日本建办事处了。而且，他们还发布了一个专门针对日语微调的GPT-4模型……

来自主题: AI资讯

7582 点击 2024-04-17 11:00

GPT-4升级被曝引入Q*，推理/数学更强废话更少，竞技场重夺王位

新版GPT-4是在Q*的输出上微调的在竞技场重回榜一的新版GPT-4 Turbo，成功再次踩中大家嗨点

来自主题: AI资讯

5405 点击 2024-04-13 20:27

改变LoRA的初始化方式，北大新方法PiSSA显著提升微调效果

随着大模型的参数量日益增长，微调整个模型的开销逐渐变得难以接受。为此，北京大学的研究团队提出了一种名为 PiSSA 的参数高效微调方法，在主流数据集上都超过了目前广泛使用的 LoRA 的微调效果。

来自主题: AI技术研报

10696 点击 2024-04-13 16:50

没想到吧，中文互联网上最好的大模型语料库是：弱智吧

如果让你在互联网上给大模型选一本中文教材，你会去哪里取材？是知乎，是豆瓣，还是微博？一个研究团队为了构建高质量的中文指令微调数据集，对这些社交媒体进行了测试，想找到训练大模型最好的中文预料，结果答案保证让你大跌眼镜——

来自主题: AI资讯

7444 点击 2024-04-04 15:47

弱智吧：大模型变聪明，有我一份贡献

「被门夹过的核桃，还能补脑吗？」

来自主题: AI技术研报

6784 点击 2024-04-04 15:36

弱智吧竟成最佳中文AI训练数据？！中科院等：8项测试第一，远超知乎豆瓣小红书

离大谱了，弱智吧登上正经AI论文，还成了最好的中文训练数据？？

来自主题: AI技术研报

7066 点击 2024-04-04 14:14

比LoRA还快50%的微调方法来了！一张3090性能超越全参调优，UIUC联合LMFlow团队提出LISA

2022 年底，随着 ChatGPT 的爆火，人类正式进入了大模型时代。然而，训练大模型需要的时空消耗依然居高不下，给大模型的普及和发展带来了巨大困难。面对这一挑战，原先在计算机视觉领域流行的 LoRA 技术成功转型大模型 [1][2]，带来了接近 2 倍的时间加速和理论最高 8 倍的空间压缩，将微调技术带进千家万户。

来自主题: AI技术研报

9048 点击 2024-04-01 15:45

只要千元级，人人可用百亿级多模态大模型！国产「AI模盒」秒级训练推理

【新智元导读】从今天起，千元级就能解锁专属大模型了！这款搭载首颗纯国产14nm Chiplet大模型推理芯片的「深目」AI模盒，可以轻松实现百亿级参数多模态大模型的推理+微调。各种碎片化长尾算法，直接秒级生成！

来自主题: AI技术研报

7715 点击 2024-03-29 16:03

全球最强开源模型一夜易主，1320亿参数推理飙升2倍！

【新智元导读】就在刚刚，全球最强开源大模型王座易主，创业公司Databricks发布的DBRX，超越了Llama 2、Mixtral和Grok-1。MoE又立大功！这个过程只用了2个月，1000万美元，和3100块H100。

来自主题: AI技术研报

8647 点击 2024-03-28 16:09