AI TNT— 让一部分先用AI实现商业化

今天，OpenAI悄悄在博客上发布了一篇新论文——CriticGPT，而这也是前任超级对齐团队的「遗作」之一。CriticGPT同样基于GPT-4训练，但目的却是用来指正GPT-4的输出错误，实现「自我批评」。

来自主题: AI资讯

8429 点击 2024-06-28 16:07

不用打标签，也能解决视觉大模型的偏好对齐问题了。

来自主题: AI技术研报

4816 点击 2024-06-23 20:08

在人工智能领域的发展过程中，对大语言模型（LLM）的控制与指导始终是核心挑战之一，旨在确保这些模型既强大又安全地服务于人类社会。早期的努力集中于通过人类反馈的强化学习方法（RLHF）来管理这些模型，成效显著，标志着向更加人性化 AI 迈出的关键一步。

来自主题: AI技术研报

2904 点击 2024-06-23 19:39

当前主流的视觉语言模型（VLM）主要基于大语言模型（LLM）进一步微调。因此需要通过各种方式将图像映射到 LLM 的嵌入空间，然后使用自回归方式根据图像 token 预测答案。

来自主题: AI技术研报

7846 点击 2024-06-17 19:35

人类的教育方式，对大模型而言也很适用。

来自主题: AI技术研报

8932 点击 2024-06-15 15:54

随着大型语言模型（LLM）规模不断增大，其性能也在不断提升。尽管如此，LLM 依然面临着一个关键难题：与人类的价值和意图对齐。在解决这一难题方面，一种强大的技术是根据人类反馈的强化学习（RLHF）。

来自主题: AI技术研报

8569 点击 2024-06-07 10:36

解散Ilya的超级对齐团队之后，奥特曼再造了一个新的「安全委员会」。OpenAI称正训练离AGI更近一步的下一代前沿模型，不过在这90天评估期间，怕是看不到新模型发布了。

来自主题: AI资讯

9000 点击 2024-05-29 15:26

在线和离线对齐算法的性能差距根源何在？DeepMind实证剖析出炉

来自主题: AI资讯

8936 点击 2024-05-19 16:20

Ilya Sutskever离职内幕曝光，Sam Altman面临信任崩盘。

来自主题: AI资讯

5350 点击 2024-05-19 13:58

Ilya前脚刚离职，OpenAI超级对齐团队负责人Jan Leike，紧接着也官宣了。

来自主题: AI资讯

4442 点击 2024-05-16 17:14