一种基于大语言模型的行业风险知识图谱构建方法及系统
申请号:CN202511316275
申请日期:2025-09-16
公开号:CN120822594B
公开日期:2025-12-23
类型:发明专利
摘要
本发明公开了一种基于大语言模型的行业风险知识图谱构建方法及系统,涉及数据处理技术领域,首先对视频素材集进行分批次去噪与压缩处理,并通过评估自动化流程的调节效果,以决定是否需要二次优化,最终形成质量可控的各批次视频预期素材多模态数据;随后将这些多模态数据输入解析管道,计算跨模态匹配因子并判定时间错位,以动态调整时间窗口实现毫秒级对齐,再将对齐后的数据进行内容审核并智能调节核验频率,排除不合规风险;最后将审定后的多模态素材送入大语言模型进行命名实体识别、关系与事件抽取,生成结构化的风险信息并写入图谱,确保了视频清晰度、对齐精度和合规质量,有效提升了知识图谱中风险实体与关系的准确性、完备性和时效性。
技术关键词
知识图谱构建方法
大语言模型
视频
因子
关键帧内容
误差
时延偏差
风险
分布方差
滤波器
数据
多模态
动态更新
错位
比率
跨模态
频率
信噪比
命名实体识别