人大&港科大揭示大模型重要安全风险漏洞:利用概念激活向量破解大模型的安全对齐|NeurIPS 2024 关键词: AI,模型训练,对齐,SCAV,安全概念激活向量 利用概念激活向量破解大模型的安全对齐,揭示LLM重要安全风险漏洞。 来自主题: AI技术研报 2472 点击 2024-11-16 15:03