AI资讯新闻榜单内容搜索-模型训练

ACL 2025主会论文 | TRIDENT：基于三维多样化红队数据合成的LLM安全增强方法

大语言模型（LLM）已经在多项自然语言处理任务中展现出卓越能力，但其潜在安全风险仍然是阻碍规模化落地的关键瓶颈。目前社区用于安全对齐的公开数据集，往往偏重于「词汇多样性」，即让同一种风险指令尽可能用不同的表达方式出现，却很少系统考虑指令背后的「恶意意图多样性」以及「越狱策略多样性」。

来自主题: AI技术研报

8560 点击 2025-08-01 10:37

OpenAI提出的CLIP，被Meta联合谢赛宁、刘壮，扩展到全球300+语言

在人工智能领域，对比语言 - 图像预训练（CLIP）是一种流行的基础模型，由 OpenAI 提出

来自主题: AI技术研报

9327 点击 2025-07-31 15:56

LLM产品开发边界究竟在哪，我们终将面对AI的归纳偏差，哈佛MIT重磅研究

几百年前开普勒通过观测数据，总结出了行星运动的规律，例如行星沿椭圆轨道运行，这让他能精确预测行星未来的位置。这就像今天的基础模型，通过学习海量数据，可以很好地进行序列预测（比如接下一句话）。

来自主题: AI资讯

7037 点击 2025-07-31 11:11

一个“蠢问题”改写模型规则！Anthropic联创亲曝：瞄准Claude 5开发爆款应用，最强模型的价值会让人忽略成本负担

Anthropic 联合创始人 Jared Kaplan 是一名理论物理学家，研究兴趣广泛，涉及有效场论、粒子物理、宇宙学、散射振幅以及共形场论等。过去几年，他还与物理学家、计算机科学家们合作开展机器学习研究，包括神经模型以及 GPT-3 语言模型的 Scaling Law。

来自主题: AI资讯

8669 点击 2025-07-31 11:05

Writing-Zero: 打破 AI 写作天花板, 让 AI 写作更像"人"

近年来, 大语言模型 (LLM) 在数学、编程等 "有标准答案" 的任务上取得了突破性进展, 这背后离不开 "可验证奖励" (Reinforcement Learning with Verifiable Rewards, RLVR) 技术的加持。RLVR 依赖于参考信号, 即通过客观标准答案来验证模型响应的可靠性。

来自主题: AI资讯

9399 点击 2025-07-31 11:02

第三代神经网络模型：面向AI应用的脉冲神经网络

1997年，Wolfgang Maass于Networks of spiking neurons: The third generation of neural network models一文中提出，由脉冲神经元构成的网络——脉冲神经网络（SNN），能够展现出更强大的计算特性，会成为继人工神经网络后的“第三代神经网络模型”[6]。

来自主题: AI技术研报

9491 点击 2025-07-31 10:41

SPIRAL：零和游戏自对弈成为语言模型推理训练的「免费午餐」

近年来，OpenAI o1 和 DeepSeek-R1 等模型的成功证明了强化学习能够显著提升语言模型的推理能力。通过基于结果的奖励机制，强化学习使模型能够发展出可泛化的推理策略，在复杂问题上取得了监督微调难以企及的进展。

来自主题: AI技术研报

7275 点击 2025-07-31 10:10

超越DeepSeek-R1，数学形式化准确率飙升至84% | 字节&南大开源

当人工智能已经能下围棋、写代码，如何让机器理解并证明数学定理，仍是横亘在科研界的重大难题。

来自主题: AI技术研报

11062 点击 2025-07-30 11:01

自回归模型杀回图像生成！实现像素级精准控制，比Diffusion更高效可控

当下的AI图像生成领域，Diffusion模型无疑是绝对的王者，但在精准控制上却常常“心有余而力不足”。

来自主题: AI技术研报

10974 点击 2025-07-30 10:55

LeCun出手，造出视频世界模型，挑战英伟达COSMOS

2018 年，LSTM 之父 Jürgen Schmidhuber 在论文中（ Recurrent world models facilitate policy evolution ）推广了世界模型（world model）的概念，这是一种神经网络，它能够根据智能体过去的观察与动作，预测环境的未来状态。

来自主题: AI技术研报

8327 点击 2025-07-30 10:23