
从RLHF到DPO再到TDPO,大模型对齐算法已经是「token-level」
从RLHF到DPO再到TDPO,大模型对齐算法已经是「token-level」在人工智能领域的发展过程中,对大语言模型(LLM)的控制与指导始终是核心挑战之一,旨在确保这些模型既强大又安全地服务于人类社会。早期的努力集中于通过人类反馈的强化学习方法(RLHF)来管理这些模型,成效显著,标志着向更加人性化 AI 迈出的关键一步。
在人工智能领域的发展过程中,对大语言模型(LLM)的控制与指导始终是核心挑战之一,旨在确保这些模型既强大又安全地服务于人类社会。早期的努力集中于通过人类反馈的强化学习方法(RLHF)来管理这些模型,成效显著,标志着向更加人性化 AI 迈出的关键一步。
每个人都能拥有有检测AI造假的“照妖镜”了!
挖掘并建模多模态、多层次、多角度的AI合成线索。
今天凌晨,OpenAI前首席科学家Ilya Sutskever向外界透露了他的最新动态。 不要再问Ilya去哪了,他宣布创立了一家名为“安全超级智能”(Safe SuperIntelligence,简称SSI)的新公司。
最强AI音频工具来了!
DeepMind发表了一篇名为「To Believe or Not to Believe Your LLM」的新论文,探讨了LLM的不确定性量化问题,通过「迭代提示」成功将LLM的认知不确定性和偶然不确定性解耦。研究还将新推导出的幻觉检测算法应用于Gemini,结果表明,与基线方法相比,该方法能有效检测幻觉。
OpenAI研究如何破解GPT-4思维,公开超级对齐团队工作,Ilya Sutskever也在作者名单之列。
在云计算领域竞争最激烈的时代,亚马逊云科技曾提出,云计算的普惠是技术升级带来的。这个说法换到如今的生成式 AI 时代也是成立的。
OpenAI 开始训练下一个前沿模型了。在联合创始人、首席科学家 Ilya Sutskever 官宣离职、超级对齐团队被解散之后,OpenAI 研究的安全性一直备受质疑。
没有了“超级对齐”的OpenAI,或很快就将迎来大考。 不久前,OpenAI在美国举行新品发布会,虽然这次没有GPT-5、也没有AI搜索,但联动文本、图像和音频的全能大模型GPT-4o证明了他们I依然有能力引流潮流。只不过刚刚发布GPT-4o之后,OpenAI就迎来了剧变,其首席科学家Ilya Sutskever宣布离职,紧接着超级对齐团队的负责人Jan Leike也宣布离职。