摘要
本发明公开了基于动态表单的工业数据分析方法及系统,涉及数据分析技术领域,在多个系统共享数据时,系统通过重复性分析模块计算数据项的相似度Xsd,并基于此相似度筛选出重复数据组,这使得系统能够有效识别和消除冗余数据,避免了不必要的重复采集和存储,从而优化了数据存储,节省了存储资源,减少了冗余数据的负担。通过数据用途分析模块,系统能够识别重复数据组内各数据项在不同上下文中的特征。通过数据上下文向量化,分析不同上下文中的用途差异度Cyd,系统可以进一步判断哪些数据项在不同系统或业务场景中具有不同的意义,从而筛选出那些不应视为冗余的非冗余数据,这种分析确保了系统不仅仅基于数据相似度进行判断。