AI TNT— 让一部分先用AI实现商业化

搜索: RLHF

面壁智能联合清华发布最新多模态对齐框架RLHF-V，减少“过泛化”幻觉达业内最佳水平

多模态技术是 AI 多样化场景应用的重要基础，多模态大模型（MLLM）展现出了优秀的多模态信息理解和推理能力，正成为人工智能研究的前沿热点。上周，谷歌发布 AI 大模型 Gemini，据称其性能在多模态任务上已全面超越 OpenAI 的 GPT-4V，再次引发行业的广泛关注和热议。

来自主题: AI资讯

2186 点击 2023-12-18 14:21

用RLHF 2%的算力让LLM停止有害输出，字节提出LLM遗忘学习

随着大型语言模型（LLM）的发展，从业者面临更多挑战。如何避免 LLM 产生有害回复？如何快速删除训练数据中的版权保护内容？如何减少 LLM 幻觉（hallucinations，即错误事实）? 如何在数据政策更改后快速迭代 LLM？这些问题在人工智能法律和道德的合规要求日益成熟的大趋势下，对于 LLM 的安全可信部署至关重要。

来自主题: AI资讯

6472 点击 2023-12-13 15:35

一文盘点2023人工智能进展，不止大模型而已

RLHF今年虽然爆火，但实打实用到的模型并不多，现在还出现了替代方案，有望从开源界“出圈”；大模型透明度越来越低，透明度最高的是Llama 2，但得分也仅有54；

来自主题: AI资讯

4726 点击 2023-11-16 23:35

RLHF再也不需要人类了！谷歌团队研究证明，AI标注已达人类水平

谷歌团队的最新研究提出了，用大模型替代人类，进行偏好标注，也就是AI反馈强化学习（RLAIF）。

来自主题: AI技术研报

2615 点击 2023-09-05 15:35