对话数据生成方法和装置、电子设备及存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
对话数据生成方法和装置、电子设备及存储介质
申请号:CN202411079549
申请日期:2024-08-06
公开号:CN119066168A
公开日期:2024-12-03
类型:发明专利
摘要
本申请实施例提供了一种对话数据生成方法和装置、电子设备及存储介质,属于金融科技技术领域。该方法包括:获取具有金融领域知识的目标文本;对目标文本进行文本分割,得到多个文本段落;针对每个文本段落,对文本段落进行摘要生成,得到文本段落的目标摘要,并将目标摘要确定为对话回复;通过预设的对话生成模型对对话回复进行问题生成,得到对话回复对应的目标问题;基于对话回复和目标问题,构建初步对话数据;对初步对话数据进行数据增强,得到目标对话数据,对话数据用于作为样本数据对预设的交互对话模型进行训练。本申请实施例能够高效、快捷地扩充用于训练交互对话模型的对话数据的数据量。
技术关键词
文本段落 数据生成方法 对话生成模型 摘要 注意力 数据生成装置 前馈神经网络 编码特征 金融科技技术 电子设备 文本编码器 可读存储介质 话题 处理器 同义词 样本 存储器