嵌入科技文本语义特征编码的两阶段分类方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
嵌入科技文本语义特征编码的两阶段分类方法及系统
申请号:CN202510973914
申请日期:2025-07-15
公开号:CN120873193A
公开日期:2025-10-31
类型:发明专利
摘要
本发明公开了嵌入科技文本语义特征编码的两阶段分类方法及系统,涉及自然语言处理技术领域,该方法包括:提取局部和全局主题特征构建主题语义特征,基于词项依存关系进行分层聚合构建结构语义特征;将二者嵌入LLMs编码层,生成融合特征序列;通过解码器提取分类特征并进行二分类判断,得到价值句序列;构建类别特征模板并计算子类语义特征;通过语义感知路由机制和混合专家模型进行多分类。本发明解决了现有文本分类无法充分利用深层语义信息,导致分类精度不足,且在类别不平衡和细粒度分类中表现不佳的技术问题,达到了通过引入双重语义特征编码和混合专家模型,显著提升分类精度,以及类别不平衡和细粒度分类能力的技术效果。
技术关键词
语义特征 主题语义 特征模板 文本 分类方法 主题特征 序列 分层特征 融合特征 编码 阶段 细粒度分类 科技 滑动窗口 解码器 机制 前馈神经网络 注意力