ChatGPT 人工智能 GPT4 伦理 生成式 医疗 监管 安全 机器学习 深度学习 神经网络 计算机视觉 强化学习 模型 算法 应用 开发 研究 工具 平台 框架 数据集 训练 部署 安全 合规 培训 投资 LLM,llm AI,ai,Ai 大模型 大语言模型 制图 生图 绘图 文生图 文生视频 生成式AI AGI 世界模型 sora chatGPT,chatgpt,ChatGpt claude openai Llama deepseek midjourney 红熊猫模型 Red panda,panda Stable Diffusion,StableDiffusion,stable DALL- E 3 DALL E DALL Flux,flux 扩散模型 混元大模型 文心一言 通义千问 可灵 Pika PixelDance 豆包 月之暗面 零一万物 阶跃星辰 搜索增强 MiniMax Talkie Agent prompt fastai LangChain TTS 微调 提示词 知识库 智能体
# 热门搜索 #
搜索
比利时:打造首个追踪仇恨言论的 AI 大模型(CaLICO)
5855点击    2024-09-08 11:27

1 概 述  


根据《联合国消除仇恨言论战略和行动计划》,仇恨言论是指因为个人或群体的身份(宗教、族裔、国籍、种族、肤色、血统、性别或其他身份因素)而攻击他们或对他们使用贬损或歧视性语言的任何言论、文字或行为交流。仇恨言论已成为传播分裂言论的最常用方式之一。仇恨言论煽动了暴力和不容忍,随着互联网的普及,社交媒体虽然提供了交流观点的平台,但因其虚拟性和匿名性也加剧了仇恨言论的传播,因此自动侦测仇恨言论对于维护社交媒体平台的文明发展至关重要。



2、项目概况

2.1 CaLICO大模型说明


比利时的人工智能公司Textgain近日宣布,计划在接下来的一年内完成一个名为CaLICO的大型语言模型的开发。该模型旨在检测所有24种欧盟官方语言的在线仇恨言论。Textgain公司目标是长期成为基于AI的多语言仇恨言论检测市场的领导者。CaLICO大模型的主要优势如下。


1)独立开发语言模型:


CaLICO是一个全新开发的大型语言模型,不依赖于现有的人工智能模型。与商用大型语言模型如ChatGPT或Google Translate不同,这些模型通常拒绝处理有毒语言,因此无法有效治理仇恨言论。CaLICO专注于处理这类内容,能够识别有害信息,确定其具体内容、目标人群,并理解更深层次的模式,同时避免生成类似的言论。这种独立开发能力使得CaLICO能够在OpenAI、Google和Meta等主要参与者中并驾齐驱,而非仅仅依赖于现有技术基础。


2)强调合作与应用:


Textgain公司强调与政策制定者、社交媒体公司和执法部门的合作,打击网上非法内容和虚假信息,这种策略有助于提升CaLICO大模型解决问题的可靠性和精确性,而不仅仅是提供通用解决方案或不切实际的承诺。


3)上下文理解:


CaLICO模型被设计为能够理解语言的上下文背景,能识别语句背后的意图和情感,这种深层次的理解有助于减少误报和漏报。


4)多语言能力:


该模型专门用于检测网络仇恨言论,在训练过程中可能使用了大量标注好的仇恨言论和非仇恨言论的数据集,以便它能够处理欧盟内的不同语言和文化。


5)不开放源码:


因担心他人利用该模型大规模制造仇恨言论,Textgain决定不公开其模型的源代码。这意味着模型的内部工作机制和细节不会对外界公开,从而降低了模型被复制或用于恶意目的的风险。



2.2Textgain公司介绍


Textgain公司成立于 2016 年,是安特卫普大学的AI衍生公司,位于比利时安特卫普。该公司起源于该大学的计算语言学和心理语言学(CLiPS)研究中心,该中心开发了NLP领域的创新研究技术。


Textgain为企业开发基于人工智能的数据管理和分析工具,专注于应用这些技术解决社会挑战,例如检测仇恨言论、虚假信息和暴力极端主义。服务范围从文本分析到衡量社交媒体平台和网站上的在线情绪。Textgain最近获得了巨大的推动,成为大型人工智能大挑战赛的四个获胜者之一。


大型人工智能大挑战赛是欧洲人工智能开发者的一项著名比赛,共有94家国际公司参赛。Textgain不仅赢得了250,000万欧元的奖金,还获得了在欧洲超级计算机上进行XNUMX万小时开发的时间,从而可以更快地进行新的人工智能模型训练。


2023年,Textgain发布了一款人工智能工具,可以在不与第三方共享敏感信息的情况下处理业务文档。Textgain还具有AI工具Rhetoric。该工具可以检测佛兰德斯媒体公司新闻报道中的仇恨言论。除了开发用于仇恨言论检测的AI模型外,该公司将从市场领导者的角度,专注于进一步开发SaaS应用程序。

2.3 项目合作伙伴


1)安特卫普大学(University of Antwerp)


作为Textgain的发源地,安特卫普大学提供了强大的学术支持,特别是在人工智能、语言技术和社会科学领域。大学的研究团队积极参与项目的研究和技术创新。


2)欧盟(European Union)


欧盟通过各种科技创新计划和研究项目提供资金支持,帮助项目扩大其影响力和语言覆盖范围。


3)语言学和社会科学研究机构


多家语言学和社会科学研究机构参与其中,提供文化和社会背景的分析,以及丰富的语言数据,支持AI模型的多语言处理能力。


4)技术公司和数据提供者


这些公司提供数据处理、云计算和存储等技术支持,并提供社交媒体平台和其他在线服务的数据,用于训练和优化AI模型。


5)非政府组织(NGOs)和人权组织


这些组织在识别和打击仇恨言论方面有丰富的经验,提供实践反馈和建议,确保技术应用的社会效益。


6)政府和公共部门


政府机构和公共部门提供政策支持和法律框架,确保项目的合法性和伦理性,同时利用这些技术监控和应对仇恨言论的传播。


7)学术合作伙伴


包括其他大学和研究中心,这些学术合作伙伴为项目提供了跨学科的知识和研究支持。


3、比利时在人工智能领域的地位及优势


比利时在人工智能(AI)领域虽不属全球顶尖,但凭借其独特的优势和战略定位,在特定领域展现出不俗的竞争力。


1)地理位置与国际合作


比利时地处欧洲心脏地带,毗邻多个科技发达国家。这使得比利时能够在欧盟的科技政策和项目中占据重要位置。比利时的布鲁塞尔不仅是欧盟的总部所在地,也是众多国际组织和科技公司的总部所在地,为国际合作提供了便利。


2)研究与创新环境:


比利时的AI研究依赖于其强大的世界级大学和研究机构,如鲁汶大学和布鲁塞尔自由大学,这些机构在人工智能研究方面有着显著的贡献。比利时在生物技术和制药方面的研发投入也十分突出,R&D强度远超许多国家。


3)产业集群与合作:


比利时拥有多个高效的产业集群,如布鲁塞尔南部的Charleroi生物园和根特生物能源谷。这些集群专注于不同的生物技术领域,促进了产业协同和创新。



文章来自于“锦岳智慧”,作者“锦岳智慧”。