摘要
本发明公开了一种集成梯度决策树的高斯贝叶斯仓储货量预测方法和系统,包括:对企业数据仓库中存储的仓储物流数据进行数据预处理与特征选择降维,得到预处理后的特征数据集;采用K‑Means SMOTE方法来对预处理后的特征数据集进行数据集的平衡处理;采用交叉验证网格搜索算法来获取基于梯度决策树的基学习器的最优参数组合;基于最优参数组合,使用基学习器,对平衡后的特征数据集进行特征重要性分析与特征选择降维,并初步预测仓储货量值;将基学习器的初步预测结果作为输入数据来训练高斯贝叶斯模型,以此来概率性地合并多个基学习器的输出,输出最终的预测结果。根据本发明技术方案,可以生成合成样本来平衡数据集,以此来降低类别不平衡问题,提高预测性能。