AI资讯新闻榜单内容搜索-ELF

网传DeepSeek R1更容易被越狱？这有个入选顶会的防御框架SelfDefend

近日，来自香港科技大学、南洋理工大学等机构的研究团队最新成果让这一设想成为现实。他们提出的 SelfDefend 框架，让大语言模型首次拥有了真正意义上的 ' 自卫能力 '，能够有效识别和抵御各类越狱攻击，同时保持极低的响应延迟。

来自主题: AI技术研报

5749 点击 2025-02-11 14:48

3个月DAU增长2.8倍，这款AI图片App避免了“一波流魔咒”？

一位“出海老兵”的自救。

来自主题: AI资讯

11179 点击 2025-01-07 10:23

代码模型自我进化超越GPT-4o蒸馏！UIUC伯克利等提出自对齐方法 | NIPS 2024

代码模型可以自己进化，利用自身生成的数据来进行指令调优，效果超越GPT-4o直接蒸馏！

来自主题: AI技术研报

7804 点击 2024-11-28 20:44

NeurIPS 2024 | 自我纠错如何使OpenAI o1推理能力大大加强？北大、MIT团队给出理论解释

自我纠错（Self Correction）能力，传统上被视为人类特有的特征，正越来越多地在人工智能领域，尤其是大型语言模型（LLMs）中得到广泛应用，最近爆火的OpenAI o1模型[1]和Reflection 70B模型[2]都采取了自我纠正的方法。

来自主题: AI技术研报

6888 点击 2024-11-18 14:54

OpenAI 将 o1 AI 模型扩展到企业和教育领域，与Anthropic直接竞争

o1 模型何以成为企业游戏规则的改变者？

来自主题: AI资讯

7744 点击 2024-09-21 14:51

OpenAI o1 self-play RL 技术路线推演

OpenAI的self-play RL新模型o1最近交卷，直接引爆了关于对于self-play的讨论。

来自主题: AI技术研报

9571 点击 2024-09-21 14:20

LLM 新范式：OpenAI o1，self-play RL 和 AGI 下半场

Self-play RL 开启 AGI 下半场

来自主题: AI资讯

8854 点击 2024-09-15 16:14

清华、北大等发布Self-Play强化学习最新综述

本文作者来自于清华大学电子工程系，北京大学人工智能研究院、第四范式、腾讯和清华-伯克利深圳学院。其中第一作者张瑞泽为清华大学硕士，主要研究方向为博弈算法。通讯作者为清华大学电子工程系汪玉教授、于超博后和第四范式研究员黄世宇博士。

来自主题: AI技术研报

9813 点击 2024-09-10 11:48

LLM 进化分岔口：多模态、成本、代码推理

头部模型的新一代模型的是市场观测、理解 LLM 走向的风向标。即将发布的 OpenAI GPT-Next 和 Anthropic Claude 3.5 Opus 无疑是 AGI 下半场最关键的事件。

来自主题: AI资讯

9136 点击 2024-09-06 11:44

LLM的范式转移：RL带来新的 Scaling Law

从几周前 Sam Altman 在 X 上发布草莓照片开始，整个行业都在期待 OpenAI 发布新模型。根据 The information 的报道，Strawberry 就是之前的 Q-star，其合成数据的方法会大幅提升 LLM 的智能推理能力，尤其体现在数学解题、解字谜、代码生成等复杂推理任务。这个方法也会用在 GPT 系列的提升上，帮助 OpenAI 新一代 Orion。

来自主题: AI资讯

9588 点击 2024-08-31 11:19