基于多源采集和分布式计算的本地知识库自动化构建系统
申请号:CN202511234490
申请日期:2025-09-01
公开号:CN120723742B
公开日期:2025-11-11
类型:发明专利
摘要
本发明提供一种基于多源采集和分布式计算的本地知识库自动化构建系统,涉及计算机系统技术领域。该系统包括多源数据采集器和分布式数据处理解析模块;其中,多源数据采集器实现多源数据的接入、数据采集、数据传输以及增量更新,生成增量变更记录;分布式数据处理解析模块包括多个分布式节点,用于对多源数据采集器采集的数据,依据增量变更记录对数据文件进行分布式处理和解析,并建立本地知识库。该系统可以实现本地知识库的自动化构建,提高知识库构建效率,压缩知识库构建周期,保证知识数据鲜活性,提升数据质量。
技术关键词
自动化构建系统
分布式数据处理
数据传输模块
数据采集器
探针模块
分块
数据快照创建
可配置自定义
数据源获取数据
增量更新
策略
介质
文件存储路径
动态资源分配
深度学习算法
容错机制
列表