摘要
本发明公开了应用于相机图像编辑的操作交互方法及系统,涉及图像处理技术领域,包括,基于多模态交互数据包,获取语音语义热图、指向强度图、触摸置信度图与注视置信度图,同时计算图像特征矩阵,并通过归一化尺度融合为多模态证据图;根据图像特征矩阵执行语义分割得到语义分割初稿与逐像素类别置信度,将多模态证据图作为置信度调制因子对逐像素类别置信度进行位置相关加权,生成候选对象掩膜序列;对候选对象掩膜序列进行高亮展示,并结合多模态证据图执行冲突消解与优先级重排,生成目标对象掩膜。本发明实现了交互意图与图像分割的深度融合,提升了候选区域检测的精度与一致性,提高了实时渲染的稳定性与编辑结果的可靠性。