AI越会思考,越容易被骗?「思维链劫持」攻击成功率超过90%
AI越会思考,越容易被骗?「思维链劫持」攻击成功率超过90%独立研究者 Jianli Zhao 等人近日的一项新研究发现,通过在有害请求前填充一长串无害的解谜推理序列(harmless puzzle reasoning),就能成功对推理模型实现越狱攻击。他们将这种方法命名为思维链劫持(Chain-of-Thought Hijacking)。
独立研究者 Jianli Zhao 等人近日的一项新研究发现,通过在有害请求前填充一长串无害的解谜推理序列(harmless puzzle reasoning),就能成功对推理模型实现越狱攻击。他们将这种方法命名为思维链劫持(Chain-of-Thought Hijacking)。
马斯克似乎并不想翻篇,转发了一位博主 po 出的 Ilya 最新证词的帖子,称这是「一个 52 页的故事」。在这份证词中,Ilya Sutskever 曝出了他围绕罢免 Sam Altman 所采取的关键行动。
我去,一进入 11 月就有大惊喜。 今天看到 Lovart 开始支持图层编辑功能,相当炸裂,绝对会成为近几年 AI 图像领域的一个关键里程碑事件。 过去,如果你在业务中,带着一个真实的目标,使用 AI
我深入研究了 Supermemory 的技术方案后,发现它和市面上其他记忆解决方案有本质区别。大多数所谓的"记忆"系统,本质上只是一个数据库,提供基本的增删改查功能。你可以保存一个实体,给它设定用户范围,然后查询出来。这很有用,但这只是基础功能,任何数据库都能做到。
当地时间 10 月 31 日,由于涌入预印本平台 arXiv 的计算机科学(CS,Compute Science)的由 AI 生成或 AI 辅助生成的综述论文和立场论文数量变得难以管理,arXiv 更新了关于综述论文和立场论文的审核规则,要求这两类论文必须被期刊或会议接收并完成同行评审之后才能提交到 arXiv 的 CS 类别。
如果我不说,你能分清哪个是马斯克本人的声音吗?
在人工智能领域,推理语言模型(RLM)虽然在数学与编程任务中已展现出色性能,但在像医学这样高度依赖专业知识的场景中,一个亟待回答的问题是:复杂的多步推理会帮助模型提升医学问答能力吗?要回答这个问题,需要构建足够高质量的医学推理数据,当前医学推理数据的构建存在以下挑战:
用外卖的打法做AI模型?美团这是跟“又快又稳”杠上了(doge)。
旧金山的超级独角兽,Brex,一家金融科技公司,做 Startup 内部的商业信用卡和现金管理平台。他们在公司内部运营的 AI 化上,非常非常激进,几乎完全实现了流程自动化。
AI漫画创作的“拍立得”时刻来喽!