AI资讯新闻榜单内容搜索-人工智能

从RLHF到DPO再到TDPO，大模型对齐算法已经是「token-level」

在人工智能领域的发展过程中，对大语言模型（LLM）的控制与指导始终是核心挑战之一，旨在确保这些模型既强大又安全地服务于人类社会。早期的努力集中于通过人类反馈的强化学习方法（RLHF）来管理这些模型，成效显著，标志着向更加人性化 AI 迈出的关键一步。

来自主题: AI技术研报

5996 点击 2024-06-23 19:39

“从横向来看，我们显然仍与国际顶尖工作如Sora和GPT-4o有显著差距；同时，从纵向来看，我们已经从十几年的nobody，快速成长为人工智能科技创新的关键推动者。面向即将到来的AGI时代，我们应该更加自信积极地投身其中。”

来自主题: AI资讯

10589 点击 2024-06-23 11:41

智能创新，人机共融。

来自主题: AI资讯

10234 点击 2024-06-23 11:05

自 ChatGPT 发布以来，大型语言模型（LLM）已经成为推动人工智能发展的关键技术。

来自主题: AI技术研报

11400 点击 2024-06-22 23:02

美国财政部刚刚公布了全新禁令，禁止美国人对某些终端用途的人工智能，以及使用特定计算能力的系统进行投资；而即使是开发未被禁止的AI系统或芯片相关交易，也需要上报。

来自主题: AI资讯

11966 点击 2024-06-22 22:32

人工智能技术创新与产业发展综合实力将进入全国第一方阵。

来自主题: AI资讯

10421 点击 2024-06-21 11:34

AI，改变了体育直播的什么？

来自主题: AI资讯

12249 点击 2024-06-20 22:22

AI会不会在未来统治人类？

来自主题: AI资讯

9018 点击 2024-06-20 22:11

在中国，最近1年内诞生了5家生成式AI独角兽：月之暗面、MiniMax、零一万物、百川智能、智谱AI。

来自主题: AI资讯

8907 点击 2024-06-20 13:46

麦当劳宣布其与IBM合作进行的得来速人工智能语音点餐技术测试期结束，该技术已在100多家餐厅部署，这些餐厅将在下个月暂停此项服务。麦当劳表示，将会为自动点赞技术寻求新的合作方，潜在的合作伙伴可能包括OpenAI的Whisper/ChatGPT和谷歌的Gemini。

来自主题: AI资讯

12471 点击 2024-06-20 11:20