视频大语言模型安全评估与防御方法、系统、设备及介质

申请号：CN202511338955

申请日期：2025-09-18

公开号：CN120833574B

公开日期：2025-11-25

类型：发明专利

摘要

本发明公开了一种视频大语言模型安全评估与防御方法、系统、设备及介质，它们是相对应的方案，方案中：构建的视频风险评估数据集规模大且覆盖全面，层次化和多语言的设计，使数据集具有更强的风险泛化能力，可有效提升模型在实际部署环境中的表现和安全性。双阶段的后训练策略中，第一阶段的方法为上下文感知型风险检测令牌微调方法，可以显著提高了模型在处理复杂输入时对风险信号的感知能力；第二阶段的方法为安全性奖励驱动的动态策略优化方法，可以提高策略训练的稳定性与泛化性。最终获得的优化后的视频大语言模型可以高效实现风险检测与安全响应，特别适用于实时内容审核、在线教育问答、政务视频监控等场景。

技术关键词

大语言模型令牌视频风险文本数据注意力机制多语言视觉序列策略优化方法实时内容微调方法打分器防御系统处理器超参数可读存储介质政务