摘要
本发明涉及一种基于随机森林的双谱自适应阈值特征选择方法,包括:通过随机森林模型获取特征重要性分数;基于特征重要性分数,计算特征重要性的一阶导数,构建梯度谱,并获取梯度谱的阈值候选点;构建特征的累积重要性贡献谱,获取累积重要性贡献谱的阈值候选点;综合梯度谱和累积重要性贡献谱的阈值候选点,通过优化分数函数评估每个候选阈值点,确定最优特征。本发明首次在降雨模拟领域系统性应用双谱特征选择,实现高维气象数据的智能化特征筛选,为精细化气象预报提供技术支撑;本发明可直接集成到现有的气象预报业务系统,通过精确的特征选择提高预报精度,减少灾害损失,降低计算资源消耗,节约运营成本,提高模型部署和维护的效率。