基于大语言模型的文本知识库的构建方法、计算机设备及程序产品
申请号:CN202511296914
申请日期:2025-09-11
公开号:CN120804233B
公开日期:2026-01-02
类型:发明专利
摘要
本发明涉及自然语言处理技术领域,其特别涉及一种文本知识库的构建方法、计算机设备及程序产品。本发明提供的一种文本知识库的构建方法,通过大语言模型提取原文本的一级标题;基于一级标题对原文本进行切分,获得与一级标题数量对应的一级文本;将不满足预设终止切分条件的一级文本进行并行递进式的切分,直至切分后的子文本满足预设终止切分条件时,停止切分;基于原文本的主标题和切分后的所有一级文本和子文本构建多层次的文本结构树。实现了逐层识别文本结构并递归构建多层次的文本结构树,不仅保留了原文本原有的逻辑层级,还减少了语义割裂与结构混乱的问题,使得各个层级关系清晰可控,有效提升知识组织的严谨性与完整性。
技术关键词
文本
大语言模型
节点
多层次
计算机设备
层级
储存器
计算机程序产品
自然语言
处理器
语义
列表
关系
嵌套
逻辑
标识
组织
指令