一种基于多模态大模型的长视觉序列生成方法及装置
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
一种基于多模态大模型的长视觉序列生成方法及装置
申请号:
CN202410847349
申请日期:
2024-06-27
公开号:
CN118828135A
公开日期:
2024-10-22
类型:
发明专利
摘要
本发明公开了一种基于多模态大模型的长视觉序列生成方法及装置。该方法包括:获取训练用的多模态剧本数据;渲染器的训练和优化;自回归模型的训练;故事的生成。该装置包括:获取模块,用于得到训练用的多模态剧本数据;渲染器训练优化模块;自回归模型训练模块;生成模块。本发明能同时做到长故事与长视频的生成,不仅在视觉质量和叙事质量上取得了优越的表现,而且有效地将生成内容的持续时间显著延长。
技术关键词
序列生成方法
关键帧
多模态
图片
编码器
序列生成装置
视觉
视频生成模型
计算机设备
文本
模型训练模块
人脸特征提取
数据
可读存储介质
存储计算机程序
计算机程序产品
存储器
系统为您推荐了相关专利信息
1
基于多模态数据融合的心理异常风险实时评估系统
多模态数据融合
评估系统
数据获取模块
心理
信号检测器
2
一种具有自适应搅肥能力的智能施肥方法
智能施肥方法
李雅普诺夫指数
肥料
卡尔曼滤波融合
动态潮解
3
界面测试方法、装置、设备和存储介质
生成测试报告
界面测试方法
样本
元素
数据
4
一种优化低轨卫星网络星间切换的异构数据融合方法
异构数据融合方法
低轨卫星网络
时空融合特征
节点特征
令牌
5
一种基于多源弱监督的图像显著性检测方法及系统
注意力
图像
层级
RGB特征
标签