摘要
本发明公开了一种化工造价数据清洗方法及系统,该方法包括:S1.将化工领域多个专业的异构数据源集合并形成多模态数据库,S2.对所述多模态数据库中的非结构化数据和实时流数据转换为结构化数据,S3.提取S2中多模态数据库的术语,构建动态更新的跨专业术语映射库;S4.对跨专业术语映射库中的术语进行智能清洗并输出标准化术语库;S5.对标准化术语库采用双重验证机制提升识别准确率。本发明提供的化工造价数据清洗方法及系统,构建了多模态数据库,通过融合领域知识图谱与深度学习模型,实现跨专业术语的精准对齐与动态更新,并生成标准化数据库,有效解决了化工造价数据“多源异构、语义割裂”的行业难题,为智能造价分析提供高质量数据基础。