一种基于RGB与骨骼点双通道的独立手语识别方法及系统
申请号:CN202510524218
申请日期:2025-04-24
公开号:CN120412025A
公开日期:2025-08-01
类型:发明专利
摘要
一种基于RGB与骨骼点双通道的独立手语识别方法及系统,属于深度学习图像处理及视频识别技术领域。本发明使用采集的手语视频提取骨骼点视频,根据骨骼点视频剔除多余部分,构建了基于RGB和骨骼点双通道的手语识别模型,将手语视频和骨骼点视频输入模型,使用一维卷积提取时间特征,使用二维卷积提取空间特征,将双通道的时间特征、空间特征融合后进行分类识别。双通道输入增强了模型对手语动作的理解,有效减少手语者不同、光照和背景等因素对识别过程的影响,且能通过骨骼点视频判断手势的开始和结束,提升了手语识别的准确性。此外,本发明将三维卷积网络拆分为一维卷积网络和二维卷积网络,降低了模型参数,提升了手语识别的实时性。
技术关键词
手语识别方法
骨骼关键点
手语识别系统
卷积模块
视频采集模块
深度学习图像处理
手势
特征提取单元
识别模块
加权平均法
二维卷积网络
视频识别技术
积层
Adam算法
输入端
图片