比利时：打造首个追踪仇恨言论的 AI 大模型（CaLICO）

7697点击 2024-09-08 11:27

1 概述

根据《联合国消除仇恨言论战略和行动计划》，仇恨言论是指因为个人或群体的身份（宗教、族裔、国籍、种族、肤色、血统、性别或其他身份因素）而攻击他们或对他们使用贬损或歧视性语言的任何言论、文字或行为交流。仇恨言论已成为传播分裂言论的最常用方式之一。仇恨言论煽动了暴力和不容忍，随着互联网的普及，社交媒体虽然提供了交流观点的平台，但因其虚拟性和匿名性也加剧了仇恨言论的传播，因此自动侦测仇恨言论对于维护社交媒体平台的文明发展至关重要。

2、项目概况

2.1 CaLICO大模型说明

比利时的人工智能公司Textgain近日宣布，计划在接下来的一年内完成一个名为CaLICO的大型语言模型的开发。该模型旨在检测所有24种欧盟官方语言的在线仇恨言论。Textgain公司目标是长期成为基于AI的多语言仇恨言论检测市场的领导者。CaLICO大模型的主要优势如下。

1)独立开发语言模型：

CaLICO是一个全新开发的大型语言模型，不依赖于现有的人工智能模型。与商用大型语言模型如ChatGPT或Google Translate不同，这些模型通常拒绝处理有毒语言，因此无法有效治理仇恨言论。CaLICO专注于处理这类内容，能够识别有害信息，确定其具体内容、目标人群，并理解更深层次的模式，同时避免生成类似的言论。这种独立开发能力使得CaLICO能够在OpenAI、Google和Meta等主要参与者中并驾齐驱，而非仅仅依赖于现有技术基础。

2)强调合作与应用：

Textgain公司强调与政策制定者、社交媒体公司和执法部门的合作，打击网上非法内容和虚假信息，这种策略有助于提升CaLICO大模型解决问题的可靠性和精确性，而不仅仅是提供通用解决方案或不切实际的承诺。

3)上下文理解：

CaLICO模型被设计为能够理解语言的上下文背景，能识别语句背后的意图和情感，这种深层次的理解有助于减少误报和漏报。

4)多语言能力：

该模型专门用于检测网络仇恨言论，在训练过程中可能使用了大量标注好的仇恨言论和非仇恨言论的数据集，以便它能够处理欧盟内的不同语言和文化。

5)不开放源码：

因担心他人利用该模型大规模制造仇恨言论，Textgain决定不公开其模型的源代码。这意味着模型的内部工作机制和细节不会对外界公开，从而降低了模型被复制或用于恶意目的的风险。

比利时：打造首个追踪仇恨言论的 AI 大模型（CaLICO）

2.2Textgain公司介绍

Textgain公司成立于 2016 年，是安特卫普大学的AI衍生公司，位于比利时安特卫普。该公司起源于该大学的计算语言学和心理语言学(CLiPS)研究中心，该中心开发了NLP领域的创新研究技术。

Textgain为企业开发基于人工智能的数据管理和分析工具，专注于应用这些技术解决社会挑战，例如检测仇恨言论、虚假信息和暴力极端主义。服务范围从文本分析到衡量社交媒体平台和网站上的在线情绪。Textgain最近获得了巨大的推动，成为大型人工智能大挑战赛的四个获胜者之一。

大型人工智能大挑战赛是欧洲人工智能开发者的一项著名比赛，共有94家国际公司参赛。Textgain不仅赢得了250,000万欧元的奖金，还获得了在欧洲超级计算机上进行XNUMX万小时开发的时间，从而可以更快地进行新的人工智能模型训练。

2023年，Textgain发布了一款人工智能工具，可以在不与第三方共享敏感信息的情况下处理业务文档。Textgain还具有AI工具Rhetoric。该工具可以检测佛兰德斯媒体公司新闻报道中的仇恨言论。除了开发用于仇恨言论检测的AI模型外，该公司将从市场领导者的角度，专注于进一步开发SaaS应用程序。