摘要
本发明公开了嵌入科技文本语义特征编码的两阶段分类方法及系统,涉及自然语言处理技术领域,该方法包括:提取局部和全局主题特征构建主题语义特征,基于词项依存关系进行分层聚合构建结构语义特征;将二者嵌入LLMs编码层,生成融合特征序列;通过解码器提取分类特征并进行二分类判断,得到价值句序列;构建类别特征模板并计算子类语义特征;通过语义感知路由机制和混合专家模型进行多分类。本发明解决了现有文本分类无法充分利用深层语义信息,导致分类精度不足,且在类别不平衡和细粒度分类中表现不佳的技术问题,达到了通过引入双重语义特征编码和混合专家模型,显著提升分类精度,以及类别不平衡和细粒度分类能力的技术效果。