摘要
本发明提出了一种基于文本引导的级联网络行人过街意图预测方法及系统,涉及智能交通系统中的行人行为分析技术领域,该方法包括:使用车载摄像机采集道路视频,基于YOLO算法检测道路视频中的行人,提取具有连续帧的行人坐标序列;对行人坐标序列依次进行维度扩展和特征提取,获取与行人坐标序列对应的预测行人坐标;将行人坐标序列与预测行人坐标进行拼接,获取完整坐标序列特征;基于大语言模型生成的结构化提示词和行人过街视频,生成与结构化提示词对应的过街行为描述,将过街行为描述编码为行为描述特征;通过余弦相似度函数将完整坐标序列特征与行为描述特征进行特征对齐,获取行人意图预测结果。本申请有助于提升对行人动态意图的表达能力。