一种基于混合稀疏注意力神经网络的文本生成方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于混合稀疏注意力神经网络的文本生成方法
申请号:CN202510063782
申请日期:2025-01-15
公开号:CN119990119A
公开日期:2025-05-13
类型:发明专利
摘要
本发明提供一种基于混合稀疏注意力神经网络的文本生成方法,涉及自然语言处理技术领域,该方法为对文本采集数据集进行分词处理,分别得到训练集、验证集和测试集;利用混合稀疏注意力机制,构建文本生成神经网络;将训练集输入文本生成神经网络,利用自回归和自编码进行训练,得到训练好的文本生成神经网络;将验证集和测试集输入训练好的文本生成神经网络,利用推理时间、显存占用和困惑度三个指标进行性能评估,得到最终的文本生成神经网络;其中,最终的文本生成神经网络用于对文本采集数据进行分析,得到文本生成结果,完成基于混合稀疏注意力神经网络的文本生成。本发明解决了长文本数据计算复杂度高和资源消耗大的问题。
技术关键词
生成神经网络 注意力神经网络 文本生成方法 注意力机制 训练集 标识符技术 生成标识符 数据 分词 矩阵 表达式 自然语言 编码 指标 复杂度 模块 索引