摘要
本发明公开了基于语义交互的智能化数据分析方法及系统,属于大数据处理与分析技术领域,本发明要解决的技术问题为传统数据分析方法在处理大规模、多维度且语义复杂的数据集时存在的局限性、分析深度不足,采用的技术方案为:多模态数据采集与预处理数据:从多源异构数据源高效采集数据,通过去除重复数据、补充缺失值以及错误数据替换方式对采集到的多模态数据进行分布式清洗,将清洗后的数据进行标注和分类,构建语料库;利用语料库对预训练语言模型进行训练,生成具备语义智能化解析能力的语义交互模型;基于训练好的语义交互模型对用户输入内容进行分析处理,最终输出符合用户要求的数据结果集。