AI资讯新闻榜单内容搜索-微调

OpenAI直播第二弹！奥特曼2024年最大惊喜竟来自字节？强化微调让o1-mini逆袭o1

OpenAI第二天的直播，揭示了强化微调的强大威力：强化微调后的o1-mini，竟然全面超越了地表最强基础模型o1。而被奥特曼称为「2024年我最大的惊喜」的技术，技术路线竟和来自字节跳动之前公开发表的强化微调研究思路相同。

来自主题: AI资讯

7665 点击 2024-12-07 16:03

OpenAI 12连发第2弹：强化微调，少量样本就能训练自己的专家模型

强化微调可以轻松创建具备强大推理能力的专家模型。

来自主题: AI技术研报

8846 点击 2024-12-07 11:46

刚刚，OpenAI又发布了一个“期货”

就在刚刚，OpenAI 年底的 AI 春晚迎来了第二弹。如果说昨天的 ChatGPT Pro 订阅计划震撼了普通用户的钱包，那么今天推出的产品则转向了不同的目标客户群体——企业机构和开发者。

来自主题: AI资讯

7377 点击 2024-12-07 10:52

OpenAI强化微调登场：几十条数据o1-mini反超o1暴涨80%，奥特曼：今年最大惊喜

OpenAI“双12”直播第二天，依旧简短精悍，主题：新功能强化微调（Reinforcement Fine-Tuning），使用极少训练数据即在特定领域轻松地创建专家模型。少到什么程度呢？最低几十个例子就可以。

来自主题: AI资讯

11060 点击 2024-12-07 09:26

清华UCSD提出全新微调方法，8B小模型媲美GPT-4o！科学问题正确率提高28%

最近，一支来自UCSD和清华的研究团队提出了一种全新的微调方法。经过这种微调后，一个仅80亿参数的小模型，在科学问题上也能和GPT-4o一较高下！或许，单纯地卷AI计算能力并不是唯一的出路。

来自主题: AI技术研报

9549 点击 2024-12-02 15:53

如何使用OpenAI fine-tuning(微调)训练属于自己的专有模型？

Fine-tuning理论上很复杂，但是OpenAI把这个功能完善到任何一个人看了就能做出来的程度。我们先从原理入手，你看这张图，左边是Pre-trained LLM （预训练大模型模型），也就是像ChatGPT这样的模型；右边是Fine-tuned LLM （微调过的语言大模型），中间就是进行微调的过程，它需要我们提供一些「ChatGPT提供不了但是我们需要的东西」。

来自主题: AI技术研报

10523 点击 2024-12-01 10:56