摘要
本发明适用于生物信息学技术领域,提供了基于微生物毒力因子功能基因集的机器学习分类方法。该方法从宏基因组和宏转录组数据中提取毒力因子相关信息,经质量控制、匹配定量后,结合VFDB数据库中14个毒力因子功能类,通过单样本基因集富集分析计算每个样本在各功能类上的得分,形成特征样本矩阵,再利用XGBoost模型进行分类。该方法考虑到毒力因子的重要作用,通过功能类打分方法减少特征数量,提高分类稳健性和推广性,支持单个样本分析。模型验证结果显示,其在训练集和测试集上均表现出较优的分类效能,AUC大于0.90,灵敏度、特异度、准确度、精准度和召回率均≥80%,为基于微生物特征的类别区分提供了有效手段。