摘要
本发明公开了一种基于孪生网络的非结构化数据连接查询优化系统及方法,属于非结构化数据处理领域。包括:特征提取模块,使用深度学习模型提取不同类型非结构化数据的特征向量;孪生网络模块,将特征向量转换为低维嵌入空间;判断层模块,将特征差异和原始特征拼接后,经过全连接网络输出连接匹配概率;阈值决策模块,通过自适应映射和网格搜索确定最佳上下阈值对,并将连接匹配概率划分为自动决策区和复核区,复核区通过专用推理模型进一步判断连接关系;查询优化模块,基于连接匹配结果优化非结构化数据的查询执行计划。本发明能够实现高效的非结构化数据库连接操作,支持自动决策和精确复核机制,显著提高数据库查询连接操作的准确率和效率。