基于强化学习的营销文案自动生成方法、装置及存储介质
申请号:CN202511241555
申请日期:2025-09-02
公开号:CN120746646B
公开日期:2025-11-21
类型:发明专利
摘要
本申请提供一种基于强化学习的营销文案自动生成方法、装置及存储介质。该方法包括:对公开文案数据进行语义匹配检索得到候选文案;将插槽化改写指令输入预生成语言模型,生成第一营销文案;对预设基础语言模型执行监督微调训练,得到第一训练模型;输入新的用户产品信息与推广要求至第一训练模型,生成第二营销文案,对第二营销文案进行打分并生成评价数据;根据评价数据构建偏序训练样本,将偏序训练样本作为奖励信号,对第一训练模型执行强化学习训练,得到第二训练模型;在文案生成系统中调用第二训练模型,基于用户的产品信息与推广要求输出目标营销文案。本申请能够实现高合规度且多约束一致的营销文案批量生成。
技术关键词
自动生成方法
评价系统
数据
生成系统
强化学习环境
指令
强化学习算法
模板
可读存储介质
标记
文本
策略
标签
语义向量
处理器
基础
生成装置
输出模块