基于大模型的音频数据语义内容匿名化方法、装置和设备

申请号：CN202510763693

申请日期：2025-06-09

公开号：CN120910301A

公开日期：2025-11-07

类型：发明专利

摘要

本发明提供一种基于大模型的音频数据语义内容匿名化方法、装置和设备，属于数据处理领域。方法包括：获取目标音频；对目标音频进行对齐处理，得到目标音频对应的目标文本和目标文本中每个字符的时间戳信息；获取多个实体类别标签，多个实体类别标签中每个实体类别标签对应一个待匿名化处理的实体类别；分别获取多个实体类别标签的提示词模板，提示词模板用于指导预设模型的输出内容；将目标文本和多个提示词模板输入预设模型，得到预设模型输出的实体识别序列，实体识别序列用于指示目标文本中包括的待匿名化处理的实体；根据时间戳信息和实体识别序列对目标音频进行匿名化处理。可以提高对音频中隐私内容的识别准确度和模型的泛化能力。

技术关键词

实体音频标签模板序列匿名化方法文本非暂态计算机可读存储介质大语言模型语义损失函数优化矩阵预训练模型数据字符处理器自然语言处理单元存储器基座

系统为您推荐了相关专利信息

基于人工智能的呼吸衰竭治疗方案推荐方法及系统

对象决策树模型推荐方法初始聚类中心多模态

一种数据资产的生成方法以及装置

资产节点数据命名实体识别模型处理单元

一种面向隐私保护的NCA-Arnold安全传输方法

面向隐私保护传输方法密钥矩阵生成哈希值

书本封底贴标覆膜装置

侧边定位机构输送线识别摄像头传动导向机构四轴机器人

用于行车数据合成的路面建模方法及系统

栅格地图路面语义标签激光点云数据建模方法