摘要
本发明涉及自然语言处理领域,提供了一种实体对表征方法及采用其的少样本文档级关系抽取方法,其中,实体对表征方法,通过实体的注意力分数,计算实体对的注意力分数;以实体对的注意力分数作为权值,加权文档的上下文嵌入,得到更强调于当前实体对的上下文表征;之后,将上下文表征与对应实体的实体嵌入进行融合,获得保留了细粒度实体语义和全局依赖信息的实体表征,并以此构建实体对表征;少样本文档级关系抽取方法,采用上述方法构建的实体对表征,通过向量组形式的关系原型,保留实例级分布的多样性,并以向量组中最大值作为最终的匹配度,减少噪声对计算的影响,因此,解决了关系原型语义不充分导致分类混淆的问题。