
ACL 2025主会论文 | TRIDENT:基于三维多样化红队数据合成的LLM安全增强方法
ACL 2025主会论文 | TRIDENT:基于三维多样化红队数据合成的LLM安全增强方法大语言模型(LLM)已经在多项自然语言处理任务中展现出卓越能力,但其潜在安全风险仍然是阻碍规模化落地的关键瓶颈。目前社区用于安全对齐的公开数据集,往往偏重于「词汇多样性」,即让同一种风险指令尽可能用不同的表达方式出现,却很少系统考虑指令背后的「恶意意图多样性」以及「越狱策略多样性」。
大语言模型(LLM)已经在多项自然语言处理任务中展现出卓越能力,但其潜在安全风险仍然是阻碍规模化落地的关键瓶颈。目前社区用于安全对齐的公开数据集,往往偏重于「词汇多样性」,即让同一种风险指令尽可能用不同的表达方式出现,却很少系统考虑指令背后的「恶意意图多样性」以及「越狱策略多样性」。
GPT-5这回是真的要来了。 现在,全网都在“偶遇”GPT-5。
本周四,知名初创公司 Manus 推出了一项重要新功能,可以通过向上百协同工作的 AI 智能体分配任务来进行广泛的研究。今年早些时候,Manus 的多智能体平台改变了人们应用 AI 工具的方式。不过现在,这家创业公司正在试图开发一种与大模型深度思考 Deep Research 同样重要的新能力。
总部位于硅谷致力于构建Agentic OS (AOS)的初创公司Creao AI宣布已连续完成两轮融资。
近期,AI 编程领域又一匹 AI Coding 黑马正在快速崛起。
大模型时代,AI基建的重要性已经不言而喻。
6 亿人用的 WPS,搞了个智能体灵犀,AI 办公直接开挂。
WAIC 2025大会上,一套国产AI同传系统技惊四座。从AI教父Hinton金句翻译
最近,国产模型开源非常多。 MiniMax、Kimi、Qwen、混元、智谱、昆仑万维等等,都在疯狂开源。
在人工智能领域,对比语言 - 图像预训练(CLIP) 是一种流行的基础模型,由 OpenAI 提出