一种基于大语言模型的行业风险知识图谱构建方法及系统

申请号：CN202511316275

申请日期：2025-09-16

公开号：CN120822594B

公开日期：2025-12-23

类型：发明专利

摘要

本发明公开了一种基于大语言模型的行业风险知识图谱构建方法及系统，涉及数据处理技术领域，首先对视频素材集进行分批次去噪与压缩处理，并通过评估自动化流程的调节效果，以决定是否需要二次优化，最终形成质量可控的各批次视频预期素材多模态数据；随后将这些多模态数据输入解析管道，计算跨模态匹配因子并判定时间错位，以动态调整时间窗口实现毫秒级对齐，再将对齐后的数据进行内容审核并智能调节核验频率，排除不合规风险；最后将审定后的多模态素材送入大语言模型进行命名实体识别、关系与事件抽取，生成结构化的风险信息并写入图谱，确保了视频清晰度、对齐精度和合规质量，有效提升了知识图谱中风险实体与关系的准确性、完备性和时效性。

技术关键词

知识图谱构建方法大语言模型视频因子关键帧内容误差时延偏差风险分布方差滤波器数据多模态动态更新错位比率跨模态频率信噪比命名实体识别