一种用于视频字幕生成的上下文语义调制方法及系统
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
验证码登录
×
发送
登录即代表您已同意AITNT
用户协议
和
隐私政策
登录
登录成功后会自动刷新界面
AITNT公众号
AITNT APP
AITNT交流群
搜索
未登录
首页
AI中心
退出
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI 源力市场
寻求报道
一种用于视频字幕生成的上下文语义调制方法及系统
申请号:
CN202511273482
申请日期:
2025-09-08
公开号:
CN120997741A
公开日期:
2025-11-21
类型:
发明专利
摘要
本发明提供了一种用于视频字幕生成的上下文语义调制方法,属于视频字幕生成领域。为了解决现有上下文语义调制方法中,存在语义对齐效果不佳,且容易忽略关键信息的问题。本发明通过整合每个输出token的上下文信息,进一步学习token间的动态注意力权重,从而实现待生成token与已生成token之间的细粒度语义对齐;该方法不仅能够更有效地建模语义关联,还能自适应地调整关键信息的语义权重,从而增强重要特征的表示,避免关键信息被忽略。
技术关键词
语义
字幕
视频
语句
矩阵
解码器
序列
可读存储介质
调制系统
注意力
文本
输出特征
计算机
编码
处理器
线性
动态