一种基于RGB与骨骼点双通道的独立手语识别方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于RGB与骨骼点双通道的独立手语识别方法及系统
申请号:CN202510524218
申请日期:2025-04-24
公开号:CN120412025A
公开日期:2025-08-01
类型:发明专利
摘要
一种基于RGB与骨骼点双通道的独立手语识别方法及系统,属于深度学习图像处理及视频识别技术领域。本发明使用采集的手语视频提取骨骼点视频,根据骨骼点视频剔除多余部分,构建了基于RGB和骨骼点双通道的手语识别模型,将手语视频和骨骼点视频输入模型,使用一维卷积提取时间特征,使用二维卷积提取空间特征,将双通道的时间特征、空间特征融合后进行分类识别。双通道输入增强了模型对手语动作的理解,有效减少手语者不同、光照和背景等因素对识别过程的影响,且能通过骨骼点视频判断手势的开始和结束,提升了手语识别的准确性。此外,本发明将三维卷积网络拆分为一维卷积网络和二维卷积网络,降低了模型参数,提升了手语识别的实时性。
技术关键词
手语识别方法 骨骼关键点 手语识别系统 卷积模块 视频采集模块 深度学习图像处理 手势 特征提取单元 识别模块 加权平均法 二维卷积网络 视频识别技术 积层 Adam算法 输入端 图片
系统为您推荐了相关专利信息
遥感图像语义分割 输出特征 融合特征 注意力 转换单元
分类模型构建方法 癫痫监测装置 异质 卷积网络模型 深度特征提取
多模态 多尺度特征融合 卷积模块 输入多尺度 多尺度特征提取
时序预测模型 智能预测方法 时序特征 经验模态分解算法 时间序列特征
帕金森病患者 姿态估计 人体关键点 视频采集模块 信息数据处理终端