摘要
本发明属于新闻文本数据挖掘技术领域,提供了一种基于区块链的新闻时政短语发现方法及系统,包括构建新闻时政短语发现模型,并将其部署到采用区块链共识机制搭建的网络节点上;将多模态训练数据输入新闻时政短语发现模型中提取向量特征,利用长短时记忆网络提取向量特征的序列特征,得到多模态高级向量特征,将多模态高级向量特征进行拼接得到多维特征向量,将多维特征向量输入分类层,输出类别的概率,结合用户反馈,优化模型参数,直到损失函数收敛;根据网络节点枚举算法,筛选出网络节点发现的共同时政短语。本发明能够有效地从多模态数据中发现和识别时政短语,并通过区块链技术保证数据的真实性和可靠性。