摘要
本发明实施例中提供了一种集成学习的AI生成新闻鉴别方法,属于数据处理技术领域,具体包括:将样本新闻文本集输入随机森林模块分别进行TF‑IDF向量化、BERT向量化和附加特征提取;将提取后的特征向量进行拼接;利用拼接特征向量训练随机森林模块;将待检测新闻文本输入训练好的随机森林模块,得到第一概率值;将待检测新闻文本输入基于首段续写的文本一致性模块,计算第一平均相似度和第一平均对数概率比;将待检测新闻文本输入基于中心句重写的文本一致性验证模块,计算第二平均相似度和第二平均对数概率比;进行加权求和,得到综合评分并据此生成待检测新闻文本的鉴别结果。通过本发明的方案,提高了识别效率、精准度和适应性。