Utopia人工智能可判断不同社交平台上的仇恨言论数量

来源: 编辑: 发布: 2021-04-23 15:16

赫尔辛基--(美国商业资讯)--据芬兰司法部委托Utopia Analytics进行的一项研究,网上仇恨言论最容易出现在论坛上。该报告发现,97%的已识别仇恨言论信息来自于论坛。随后的平台类型是占2.5%的Twitter信息和占0.2%的Instagram信息。而博客、新闻评论和公开的Facebook信息占所有已识别仇恨言论的比例不到0.02%。这些数据集不包括私人讨论,如Facebook组或帐户。

该项目是芬兰司法部 “Facts Against Hate”计划的组成部分,旨在测试人工智能在网络环境中识别仇恨言论的能力。该方法将人类评估与机器学习相结合。项目的一个关键目标是找到仇恨言论的主要渠道,并识别平台之间的差异。

仇恨言论的定义基于社会科学的学术研究结果。该定义通过如下过程完成:首先确定仇恨言论的类别,然后使用类别数据在网络信息数据集中人工识别出仇恨言论的例子。这些标注随后被用作Utopia AI Moderator的训练数据,这是一个利用文本分析和机器学习且与语言无关的工具。该项目的数据集由2020年9月至10月以芬兰语发表的1,200万条在线评论和帖子构成。

结果显示,芬兰公开的社交媒体平台上每月出现大约15万条包含仇恨言论的信息,约占所有信息的1.8%。

在国际公共社交媒体平台中,Twitter似乎最为突出,有7,450条信息被认定为仇恨言论,占所有推文的0.14%。转发在传播这些信息中发挥了重要作用:所有仇恨言论推文中有39%是重复的。

Utopia首席执行官Mari-Sanna Paukkeri博士表示:“尽管数据集主要由芬兰语消息构成,但其他语言中的结果也会非常相似。例如,芬兰仇恨言论的主要平台Ylilauta其实就是大家都熟知的4chan的芬兰版。此外,只需要两周,我们就可以建立一个类似的人工智能模型来识别其他任何语言中的仇恨言论。只需要一位具备相关技能的专业人员告诉我们对应文化和语言中如何定义仇恨言论即可,另外我们还需要具体数据来进行分析。”

媒体库/照片:https://utopiaanalytics.com/media-library

原文版本可在businesswire.com上查阅:https://www.businesswire.com/news/home/20210422005039/en/

免责声明:本公告之原文版本乃官方授权版本。译文仅供方便了解之用,烦请参照原文,原文版本乃唯一具法律效力之版本。

联系方式:

Janne Huuskonen
总监
janne.huuskonen@utopiaanalytics.com
+358 50 444 0941
utopiaanalytics.com

猜你还想看:

百度网友:曲终人离场
评论:当今社会一瞥:男人女人化;女人小孩化;小孩宠物化;宠物贵族化;贵族痞子化;痞子玩文化;文化商业化。

天猫网友:时光° Moon
评论:食堂一直是个大问题 最近越来越怀疑那些食堂的人究竟是炊事员还是饲养员 ...

猫扑网友:潇洒 小姐 Seve°
评论:他看事总乐观,看人总悲观!

腾讯网友:Curtain ( 落幕 )
评论:别以为遇见我就是你旳缘,也可能是你旳坎。

搜狐网友:笨笨Forever〃
评论:做女孩一定要经的起谎言,爱的起敷衍,忍的了欺骗,忘得了诺言,放的下一切,最后用笑来伪装你的泪眼!

本网网友:岁月静好moon
评论:爷爷说他们那个年代。谁考试不会答。就答说毛主席万岁。没人敢打叉。

天涯网友:关于病态美beauty ×
评论:我一直在希望的田野上奔跑,虽然也偶尔被失望绊倒。

其它网友:别在爱里勉强
评论:我的优点:勇于认错;缺点:坚决不改。

淘宝网友:⒈朵死亡花°
评论:电脑你别这样,让我走,我是一个有作业的人

网易网友:冷笑你的无知
评论:天平的一端放上爱情,另一端就得放上生命