基于大语言模型的文本知识库的构建方法、计算机设备及程序产品

申请号：CN202511296914

申请日期：2025-09-11

公开号：CN120804233B

公开日期：2026-01-02

类型：发明专利

摘要

本发明涉及自然语言处理技术领域，其特别涉及一种文本知识库的构建方法、计算机设备及程序产品。本发明提供的一种文本知识库的构建方法，通过大语言模型提取原文本的一级标题；基于一级标题对原文本进行切分，获得与一级标题数量对应的一级文本；将不满足预设终止切分条件的一级文本进行并行递进式的切分，直至切分后的子文本满足预设终止切分条件时，停止切分；基于原文本的主标题和切分后的所有一级文本和子文本构建多层次的文本结构树。实现了逐层识别文本结构并递归构建多层次的文本结构树，不仅保留了原文本原有的逻辑层级，还减少了语义割裂与结构混乱的问题，使得各个层级关系清晰可控，有效提升知识组织的严谨性与完整性。

技术关键词

文本大语言模型节点多层次计算机设备层级储存器计算机程序产品自然语言处理器语义列表关系嵌套逻辑标识组织指令