基于迭代式模型表征空间扩展的安全微调数据合成方法及其系统
申请号:CN202510417684
申请日期:2025-04-03
公开号:CN120509031A
公开日期:2025-08-19
类型:发明专利
摘要
本申请公开了一种基于迭代式模型表征空间扩展的安全微调数据合成方法及其系统,方法包括:采用有监督微调方式,训练意图隐藏模型,将简单恶意指令转换成意图隐藏的指令,以提高合成数据与真实攻击数据的相似性;利用训练好的意图隐藏模型,使用迭代式模型表征空间扩展技术,迭代式扩展合成安全微调语料在模型表征空间的覆盖,逐步合成安全微调数据。本发明方法利用意图隐藏模型,引入迭代式模型表征空间扩展技术对合成训练数据的内容进行控制,从而增强安全微调语料在模型表征空间中的覆盖范围,提升合成训练数据的多样性。
技术关键词
空间扩展技术
隐藏模型训练
数据
意图指令
空间扩展模块
超参数
处理器
样本
度函数
主题
语义
可读存储介质
存储器
代表
电子设备
程序
计算机