维基百科的内容质量往往取决于它的参考资料,既那些支持在线百科全书中信息的来源链接。但有时,这些参考资料或者引用是有明显问题的,比如指向了损坏的网站、或者提供了错误的信息还或者是一些不可信的来源。
10月19日发表在《自然-机器智能》(Nature Machine Intelligence)1 上的文章《利用人工智能提高维基百科的可验证性》中的研究表明,人工智能(AI)可以帮助清理维基百科条目中不准确或不完整的参考文献列表,提高其质量和可靠性。
总部位于伦敦的Samaya AI公司的法比奥-佩特罗尼和他的同事们开发了一个由神经网络驱动的系统,名为 "SIDE",它可以分析维基百科的参考文献是否支持与之相关的说法,并为那些不支持的参考文献提出更好的替代方案。
Samaya AI官网地址:https://samaya.ai/
"鉴于 ChatGPT 对引文的错误和幻觉是出了名的,用人工智能来帮助处理引文似乎有点讽刺。马萨诸塞州沃尔瑟姆本特利大学研究人工智能的诺亚-吉安西拉库萨(Noah Giansiracusa)说:"但重要的是要记住,人工智能语言模型的作用远不止聊天机器人。
SIDE 经过训练,可以利用维基百科现有的特色文章识别出好的参考文献,这些文章在网站上得到推广,并受到编辑和版主的广泛关注。
然后,它就能通过验证系统识别出页面中存在哪些劣质的参考文献。它还可以扫描互联网,查找有信誉的来源,并排列出替换不良引用的选项。
为了对该系统进行测试,Petroni 和他的同事使用 SIDE 为维基百科的特色文章推荐它以前从未见过的参考文献。在近50%的情况下,SIDE的首选参考文献已经在文章中被引用。在其他情况下,它找到了其他参考文献。
当SIDE的结果展示给一组维基百科用户时,有21%的用户更喜欢AI找到的引用,有10%的用户更喜欢现有的引用,而有39%的用户没有偏好。
瑞士苏黎世大学的计算传播科学家Aleksandra Urman指出,这个工具可以为编辑和管理员检查维基百科条目的准确性时节省很多时间,当然,前提是必须正确部署。她表示:“该系统在标记潜在不合适的引用方面可能有用,但更要重要的问题是,要发现在维基百科社区什么是最有用的。”
Urman指出,在测试SIDE系统的维基百科用户中,更有可能的是大家不喜欢AI建议的引用。她说:“这意味着在这些情况下,他们仍然会去人工在线搜索相关的引用文献。”
文章来自 “ nature ”