一种用于视频字幕生成的上下文语义调制方法及系统

申请号：CN202511273482

申请日期：2025-09-08

公开号：CN120997741A

公开日期：2025-11-21

类型：发明专利

摘要

本发明提供了一种用于视频字幕生成的上下文语义调制方法，属于视频字幕生成领域。为了解决现有上下文语义调制方法中，存在语义对齐效果不佳，且容易忽略关键信息的问题。本发明通过整合每个输出token的上下文信息，进一步学习token间的动态注意力权重，从而实现待生成token与已生成token之间的细粒度语义对齐；该方法不仅能够更有效地建模语义关联，还能自适应地调整关键信息的语义权重，从而增强重要特征的表示，避免关键信息被忽略。

技术关键词

语义字幕视频语句矩阵解码器序列可读存储介质调制系统注意力文本输出特征计算机编码处理器线性动态