AI资讯新闻榜单内容搜索-Alignment

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Alignment
Claude 3.7 sonnet系统提示词的哲学

Claude 3.7 sonnet系统提示词的哲学

Claude 3.7 sonnet系统提示词的哲学

这份提示词有很多哲学性思考,很多表达让我看到背后的设计者把claude当成一个人去设计。  我猜,应该是Amanda Askell(Anthropic负责alignment和character design,是学哲学的一位女生,也是我的榜样) 主要设计的。 

来自主题: AI技术研报
6966 点击    2025-03-02 10:22
用慢思考提升模型安全性,北交大、鹏城实验室提出系统2对齐

用慢思考提升模型安全性,北交大、鹏城实验室提出系统2对齐

用慢思考提升模型安全性,北交大、鹏城实验室提出系统2对齐

OpenAI 在 “双十二” 发布会的最后一天公开了 o 系列背后的对齐方法 - deliberative alignment,展示了通过系统 2 的慢思考能力提升模型安全性的可行性。

来自主题: AI技术研报
6969 点击    2025-01-24 14:45
全球首个法律o1大模型发布,System2范式下慢思考法律专家|港科大&北大

全球首个法律o1大模型发布,System2范式下慢思考法律专家|港科大&北大

全球首个法律o1大模型发布,System2范式下慢思考法律专家|港科大&北大

OpenAI o1风格的推理大模型,有行业垂直版了。HK-O1aw,是由香港生成式人工智能研发中心(HKGAI)旗下AI for Reasoning团队(HKAIR) 联合北京大学对齐团队(PKU-Alignment Team)推出的全球首个慢思考范式法律推理大模型。

来自主题: AI资讯
2989 点击    2024-11-09 15:34
人机对齐,通用人工智能的必由之路

人机对齐,通用人工智能的必由之路

人机对齐,通用人工智能的必由之路

随着人工智能大模型的能力日益强大,如何让其行为和目标同人类的价值、偏好、意图之间实现协调一致,即人机对齐(human-AI alignment)问题,变得越发重要。

来自主题: AI资讯
3226 点击    2024-11-02 10:35
综合RLHF、DPO、KTO优势,统一对齐框架UNA来了

综合RLHF、DPO、KTO优势,统一对齐框架UNA来了

综合RLHF、DPO、KTO优势,统一对齐框架UNA来了

随着大规模语言模型的快速发展,如 GPT、Claude 等,LLM 通过预训练海量的文本数据展现了惊人的语言生成能力。然而,即便如此,LLM 仍然存在生成不当或偏离预期的结果。这种现象在推理过程中尤为突出,常常导致不准确、不符合语境或不合伦理的回答。为了解决这一问题,学术界和工业界提出了一系列对齐(Alignment)技术,旨在优化模型的输出,使其更加符合人类的价值观和期望。

来自主题: AI技术研报
7648 点击    2024-10-10 12:21
LLM对齐综述|迈向可扩展的大模型自动对齐,中科院软件所&阿里千问发布

LLM对齐综述|迈向可扩展的大模型自动对齐,中科院软件所&阿里千问发布

LLM对齐综述|迈向可扩展的大模型自动对齐,中科院软件所&阿里千问发布

近年来,大模型的高速发展极大地改变了人工智能的格局。对齐(Alignment) 是使大模型的行为符合人类意图和价值观,引导大模型按照人类的需求和期望进化的核心步骤,因此受到学术界和产业界的高度关注。

来自主题: AI资讯
7807 点击    2024-09-12 10:10
浅谈领域模型训练

浅谈领域模型训练

浅谈领域模型训练

这篇文章对如何进行领域模型训练进行一个简单的探讨,主要内容是对 post-pretrain 阶段进行分析,后续的 Alignment 阶段就先不提了,注意好老生常谈的“数据质量”和“数据多样性”即可。

来自主题: AI技术研报
9453 点击    2024-08-24 10:54
彻底摒弃人工标注,AutoAlign方法基于大模型让知识图谱对齐全自动化

彻底摒弃人工标注,AutoAlign方法基于大模型让知识图谱对齐全自动化

彻底摒弃人工标注,AutoAlign方法基于大模型让知识图谱对齐全自动化

知识图谱作为结构化知识的重要载体,广泛应用于信息检索、电商、决策推理等众多领域。然而,由于不同机构或方法构建的知识图谱存在表示方式、覆盖范围等方面的差异,如何有效地将不同的知识图谱进行融合,以获得更加全面、丰富的知识体系,成为提高知识图谱覆盖度和准确率的重要问题,这就是知识图谱对齐(Knowledge Graph Alignment)任务所要解决的核心挑战。

来自主题: AI技术研报
5678 点击    2024-07-26 18:00
ICML 2024 Oral | DPO是否比PPO更适合LLM,清华吴翼团队最新揭秘

ICML 2024 Oral | DPO是否比PPO更适合LLM,清华吴翼团队最新揭秘

ICML 2024 Oral | DPO是否比PPO更适合LLM,清华吴翼团队最新揭秘

如何让大模型更好的遵从人类指令和意图?如何让大模型有更好的推理能力?如何让大模型避免幻觉?能否解决这些问题,是让大模型真正广泛可用,甚至实现超级智能(Super Intelligence)最为关键的技术挑战。这些最困难的挑战也是吴翼团队长期以来的研究重点,大模型对齐技术(Alignment)所要攻克的难题。

来自主题: AI资讯
10081 点击    2024-07-21 17:10
2027年通用人工智能就能实现?

2027年通用人工智能就能实现?

2027年通用人工智能就能实现?

被 OpenAI 的 Superalignment 研究团队解雇的 Leopold Aschenbrenner 最近发表了一篇关于人工智能的长篇大作,里面宣称根据他的曲线预测,人类到2027年就能实现通用人工智能。本文是对这一预测的讨论。

来自主题: AI资讯
5298 点击    2024-06-29 17:05