AI伪造高一尺,AI检测高一丈。
《智能涌现》获悉,近日数字内容伪造检测企业“中科睿鉴”,已经完成了近亿元融资,由达晨财智独家投资。据了解,该轮融资主要的用途是将业务线从ToG拓展成ToG、B和C三条产品线,实现AI鉴伪产品的规模化。
中科睿鉴成立于2020年,主打用AI技术检测AI伪造的音视图文内容,包括深度伪造(Deepfake)、生成式人工智能伪造(AIGC)、软件编辑篡改(PS)等,在AI伪造检测、虚假信息识别、多媒体内容安全审核、大模型安全评估等场景具有技术的布局,面向监管单位、企业、个人提供解决方案和产品服务。
就团队而言,中科睿鉴是数字伪造检测领域的“国家队”。创始人曹娟来自中国科学院计算技术研究所,目前担任“数字内容合成与伪造检测实验室”主任。团队已在WWW、TKDE、ACL、CVPR等国际顶会和权威学术期刊发表论文70余篇,拥有伪造检测相关发明专利50余项。
好比人的指纹,每一种大模型算法的背后,也有自己独特的特征——这种在学术上被称为“算法指纹”的特征,也成了人们用模型破解算法合成信息的突破口。
比如,在检测具有写真风格的人脸照片时,中科睿鉴的检测结果就能显示,其中有3张人像是使用AIGC技术生成,算法指纹为“Midjourney”,一种基于文生图的技术。
图像生成内容检测工具“睿图”针对Midjourney生成内容检测结果。图源:中科睿鉴
然而,随着AIGC技术原理的突破式演进,原有的检测技术已经不够用了。
曹娟告诉《智能涌现》,传统检测手段主要依靠针对垂直领域的检测小模型,但随着大模型技术的发展,伪造算法的通用性和泛化性大幅提升。这意味着,垂直检测小模型已经无法应对层出不穷的AI伪造内容。
用魔法打败魔法,同样的,中科睿鉴的应对策略是,用同样具有强泛化性的检测大模型,去应对深度伪造内容。
2023年3月,中科睿鉴发布了自研的图像生成内容检测大模型基座——“睿鉴图灵”。
据曹娟介绍,这一具有60亿参数的多模态检测模型底座,基于200TB的高质量生成数据以及场景数据训练而成,并在检测领域开创性地采取了MoE(混合专家模型)架构,优点是能够充分整合此前的40多个垂直领域检测小模型,在具体检测任务中更高效精准。
新的伪造技术一旦面世,“睿鉴图灵”就能基于自身的泛化性,快速进化出相应的检测能力。
目前,围绕全类型伪造检测、多模态数据生成、内容合规审核的核心技术,中科睿鉴布局了“模型-数据-硬件”的AI技术设施,以及面向公共安全、金融安全、媒体安全、教育安全的行业应用,实现了对文本、图像、视频、音频模态伪造内容的检测。
比如针对Stable Diffusion、Midjourney、DALL·E、VideoPoet、Sora等主流的图像视频生成技术,基于“睿鉴图灵”基座模型推出的检测引擎,平均准确率能达到90%以上。此外,应对Gen-2、Pika等十余种其他主流服务的AI生成视频,检测引擎的平均检出率超过了90%。
“睿鉴图灵”生成视频检测引擎对生成视频(左)和真实视频(右)的检测结果。图源:中科睿鉴
在曹娟看来,2023年是深度伪造检测技术规模化的元年。此前,碍于AIGC数据数量的不足和场景的单一,检测技术泛化性不足,只能在少数垂直领域发挥较好的效果。因此,G端和B端场景也是中科睿鉴业务布局的重点。
如今,随着AI伪造数据的增多,以及应用场景的扩大,检测技术也必须顺势往C端普及。早在2022年,中科睿鉴就上线了“睿鉴AI”微信小程序,面向大众开放了文本、图像和视频检测服务。曹娟告诉《智能涌现》,未来中科睿鉴将提供PC软件、App等更多形式的To C检测工具。
以下是投资人评价:
达晨财智执行董事 姜铭:
过去两年,AIGC能力爆发,公开可用的AIGC算法和应用层出不穷,使得人工生成逼真的图像、音视频变得易如反掌。无论国家、行业还是个人的安全都面临挑战,需要强大的深伪检测能力来对抗风险。鉴伪技术也正在成为守护人工智能行业安全的刚需,决定了生成技术的应用边界。
深伪检测行业具备极高的技术门槛,中科睿鉴和曹老师团队在这个领域有多年的深耕和积累,打造了体系化的能力基座,技术前沿性和实战性均居于国内头部,并在诸多重点行业和应用场景中率先做了布局。我们看好这个专注的团队,期待睿鉴可以借助本轮融资加快发展步伐,不断打磨技术、迭代产品,成为守护人工智能安全的标杆企业。
文章来源“周鑫雨”,作者“周鑫雨”