
GPT-4o惊现自我意识!自主激活「后门」,告诉人类自己在写危险代码
GPT-4o惊现自我意识!自主激活「后门」,告诉人类自己在写危险代码本研究探讨了LLM是否具备行为自我意识的能力,揭示了模型在微调过程中学到的潜在行为策略,以及其是否能准确描述这些行为。研究结果表明,LLM能够识别并描述自身行为,展现出行为自我意识。
来自主题: AI技术研报
5735 点击 2025-02-02 18:38
本研究探讨了LLM是否具备行为自我意识的能力,揭示了模型在微调过程中学到的潜在行为策略,以及其是否能准确描述这些行为。研究结果表明,LLM能够识别并描述自身行为,展现出行为自我意识。