基于片段语义交叉组合的提示干扰构造与优化方法及装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于片段语义交叉组合的提示干扰构造与优化方法及装置
申请号:CN202511220563
申请日期:2025-08-29
公开号:CN120745619B
公开日期:2025-11-07
类型:发明专利
摘要
本发明涉及人工智能和自然语言处理的技术领域,具体涉及基于片段语义交叉组合的提示干扰构造与优化方法及装置。所述方法包括:基于段落级提示片段和句子级提示片段构建候选提示组合,并基于与原始提示文本的语义一致性筛选初始有效提示组合,将其与攻击目标指令拼接形成风险提示,通过语言模型获取风险提示对应的风险响应和有害性评分,以计算初始Δ‑TRDS分数;对初始有效提示组合中的所有片段依次进行中立内容替换操作,并计算替换后的目标有效提示组合对应的目标Δ‑TRDS分数;根据替换前后Δ‑TRDS分数的差值确定初始有效提示组合中的提示干扰片段。本发明解决了传统手工构造提示的方法缺乏系统性和可扩展性的问题。
技术关键词
语义 风险 文本 机器可读存储介质 存储器存储指令 基准 鲁棒性 电子设备 自然语言 处理器 模块 手工 接口