AI资讯新闻榜单内容搜索-对齐

推理超越 Llama3！面壁Ultra对齐助推开源大模型「理科状元」

两周前，OpenBMB开源社区联合面壁智能发布领先的开源大模型「Eurux-8x22B 」。相比口碑之作 Llama3-70B，Eurux-8x22B 发布时间更早，综合性能相当，尤其是拥有更强的推理性能——刷新开源大模型推理性能 SOTA，堪称开源大模型中「理科状元」。

来自主题: AI技术研报

10645 点击 2024-05-07 22:38

这就是OpenAI神秘的Q*？斯坦福：语言模型就是Q函数

在对齐大型语言模型（LLM）与人类意图方面，最常用的方法必然是根据人类反馈的强化学习（RLHF）

来自主题: AI资讯

6087 点击 2024-04-24 10:59

OpenAI内斗第二弹！Ilya亲信、超级对齐团队2人惨遭开除，被批泄密

据外媒报道，OpenAI超级对齐团队的2名研究员，因泄露「机密」被正式开除

来自主题: AI资讯

4623 点击 2024-04-13 16:02

加入AI公司三个月，我都做了些什么？——与大模型对齐的人类工程师

本文主要内容为提示词工程师的工作实际经验和感悟。详人所略，略人所详。Prompt领域的优秀教程越来越多，基础知识可以参见社区先辈刘海同学：[23.08] 网上疯传的「AI 提示词工程师」到底是什么？

来自主题: AI资讯

8380 点击 2024-03-22 11:19

强壮全球200个大模型，OpenBMB推动开源社区对齐研究

迄今，全球超 200 个模型基于来自 OpenBMB 开源社区的 Ultra Series 数据集（面壁 Ultra 对齐数据集）对齐，数据集包括 UltraFeedback 和 UltraChat，共计月均下载量超 100 万。

来自主题: AI资讯

6692 点击 2024-03-14 16:33

仅需格式转换提升9%数学推理能力，上交开源新对齐方法ReAlign

大模型对齐新方法，让数学推理能力直接提升9%。

来自主题: AI技术研报

7218 点击 2024-03-13 11:10

OpenAI官宣开源Transformer Debugger！不用写代码，人人可以破解LLM黑箱

刚刚，OpenAI超级对齐团队负责人官宣开源Transformer调试器。研究人员不用写代码，就能快速探索LLM的内部构造了！

来自主题: AI资讯

5391 点击 2024-03-12 18:34

模型偏好只与大小有关？上交大全面解析人类与32种大模型偏好的定量组分

在目前的模型训练范式中，偏好数据的的获取与使用已经成为了不可或缺的一环。在训练中，偏好数据通常被用作对齐（alignment）时的训练优化目标，如基于人类或 AI 反馈的强化学习（RLHF/RLAIF）或者直接偏好优化（DPO），而在模型评估中，由于任务的复杂性且通常没有标准答案，则通常直接以人类标注者或高性能大模型（LLM-as-a-Judge）的偏好标注作为评判标准。

来自主题: AI技术研报

12427 点击 2024-03-02 14:58

MATRIX：社会模拟推动大模型价值自对齐，比GPT4更「体贴」

随着大语言模型（LLMs）在近年来取得显著进展，它们的能力日益增强，进而引发了一个关键的问题：如何确保他们与人类价值观对齐，从而避免潜在的社会负面影响？

来自主题: AI技术研报

11039 点击 2024-02-27 14:03

爆火Sora背后的技术，一文综述扩散模型的最新发展方向

为了使机器具有人类的想象力，深度生成模型取得了重大进展。这些模型能创造逼真的样本，尤其是扩散模型，在多个领域表现出色。扩散模型解决了其他模型的限制，如 VAEs 的后验分布对齐问题、GANs 的不稳定性、EBMs 的计算量大和 NFs 的网络约束问题。

来自主题: AI技术研报

11116 点击 2024-02-22 15:25