AI资讯新闻榜单内容搜索-微调

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 微调

更像人脑的新型注意力机制，Meta让大模型自动屏蔽任务无关信息，准确率提高27%

更像人脑的新型注意力机制，Meta让大模型自动屏蔽任务无关信息，准确率提高27%

更像人脑的新型注意力机制，Meta让大模型自动屏蔽任务无关信息，准确率提高27%

关于大模型注意力机制，Meta又有了一项新研究。通过调整模型注意力，屏蔽无关信息的干扰，新的机制让大模型准确率进一步提升。而且这种机制不需要微调或训练，只靠Prompt就能让大模型的准确率上升27%。

来自主题: AI资讯

6814 点击 2023-11-27 17:14

小模型如何进行上下文学习？字节跳动 & 华东师大联合提出自进化文本识别器

小模型如何进行上下文学习？字节跳动 & 华东师大联合提出自进化文本识别器

小模型如何进行上下文学习？字节跳动 & 华东师大联合提出自进化文本识别器

我们都知道，大语言模型（LLM）能够以一种无需模型微调的方式从少量示例中学习，这种方式被称为「上下文学习」（In-context Learning）。这种上下文学习现象目前只能在大模型上观察到。比如 GPT-4、Llama 等大模型在非常多的领域中都表现出了杰出的性能，但还是有很多场景受限于资源或者实时性要求较高，无法使用大模型。

来自主题: AI技术研报

5340 点击 2023-11-27 12:49

用视觉来做Prompt！沈向洋展示IDEA研究院新模型，无需训练或微调，开箱即用

用视觉来做Prompt！沈向洋展示IDEA研究院新模型，无需训练或微调，开箱即用

用视觉来做Prompt！沈向洋展示IDEA研究院新模型，无需训练或微调，开箱即用

用视觉来做Prompt！沈向洋展示IDEA研究院新模型，无需训练或微调，开箱即用

来自主题: AI技术研报

7687 点击 2023-11-25 22:27

Weights&Biases，支持AI明星公司训练模型的幕后英雄

Weights&Biases，支持AI明星公司训练模型的幕后英雄

Weights&Biases，支持AI明星公司训练模型的幕后英雄

有一家公司，OpenAI、Anthropic、Cohere、Aleph Alpha（欧洲顶尖大模型公司）和Hugging Face的模型训练和微调都离不开它，NVIDIA和谷歌云（GCP）都是它的深度合作伙伴，它是支持生成式AI明星公司们训练模型的幕后英雄。

来自主题: AI资讯

12226 点击 2023-11-04 10:26

港大等发布GraphGPT：1/50微调参数，准确率提升10倍！无需超长token，LLM也能读懂图结构

港大等发布GraphGPT：1/50微调参数，准确率提升10倍！无需超长token，LLM也能读懂图结构

港大等发布GraphGPT：1/50微调参数，准确率提升10倍！无需超长token，LLM也能读懂图结构

GraphGPT框架将图结构模型和大语言模型进行参数对齐，利用双阶段图指令微调范式提高模型对图结构的理解能力和适应性，再整合ChatGPT提高逐步推理能力，实现了更快的推理速度和更高的图任务预测准确率。

来自主题: AI技术研报

4187 点击 2023-10-28 21:18

谷歌开源一种AI的微调方法：逐步提炼，让小模型也能媲美2000倍体量大模型

谷歌开源一种AI的微调方法：逐步提炼，让小模型也能媲美2000倍体量大模型

谷歌开源一种AI的微调方法：逐步提炼，让小模型也能媲美2000倍体量大模型

大型语言模型能力惊人，但在部署过程中往往由于规模而消耗巨大的成本。华盛顿大学联合谷歌云计算人工智能研究院、谷歌研究院针对该问题进行了进一步解决，提出了逐步微调（Distilling Step-by-Step）的方法帮助模型训练。

来自主题: AI技术研报

5173 点击 2023-10-24 23:46

AgentLM：对齐Agent能力的大模型来了！7B/13B/70B全开源

AgentLM：对齐Agent能力的大模型来了！7B/13B/70B全开源

AgentLM：对齐Agent能力的大模型来了！7B/13B/70B全开源

智谱AI&清华KEG提出了一种对齐 Agent 能力的微调方法 AgentTuning，该方法使用少量数据微调已有模型，显著激发了模型的 Agent能力，同时可以保持模型原有的通用能力。

来自主题: AI技术研报

4811 点击 2023-10-23 10:17

0.2美元微调就能让ChatGPT彻底破防

0.2美元微调就能让ChatGPT彻底破防

0.2美元微调就能让ChatGPT彻底破防

微调LLM需谨慎，用良性数据、微调后角色扮演等都会破坏LLM对齐性能！学习调大了还会继续提高风险！

来自主题: AI技术研报

7686 点击 2023-10-14 14:09

最强LLaMA突然来袭！只改一个超参数，实现上下文3.2万token，多个任务打败ChatGPT、Claude 2

最强LLaMA突然来袭！只改一个超参数，实现上下文3.2万token，多个任务打败ChatGPT、Claude 2

最强LLaMA突然来袭！只改一个超参数，实现上下文3.2万token，多个任务打败ChatGPT、Claude 2

悄无声息，羊驼家族“最强版”来了！与GPT-4持平，上下文长度达3.2万token的LLaMA 2 Long，正式登场。

来自主题: AI技术研报

8235 点击 2023-10-02 14:05

以3D视角洞悉矩阵乘法，这就是AI思考的样子

以3D视角洞悉矩阵乘法，这就是AI思考的样子

以3D视角洞悉矩阵乘法，这就是AI思考的样子

矩阵乘法已经成为机器学习模型的构建模块，是各种强大 AI 技术的基础，了解其执行方式必然有助于我们更深入地理解这个 AI 以及这个日趋智能化的世界。

来自主题: AI技术研报

3400 点击 2023-10-02 11:48

上一页当前第29页,共30页下一页