首页 > 科学探索 > AI系统：建立多维度向量进行数据检测

AI系统：建立多维度向量进行数据检测

时间：2019-01-25 11:40:36 作者：迷迷来源：奇闻吧手机阅读

在网络时代，虚假新闻是压倒一切的，令人困惑。Facebook曾一度陷入虚假新闻的泥潭，不仅被指控影响美国总统选举的结果，还被指控触发德国政府的巨额罚款。就连以信誉著称的BBC也不能幸免。例如，BBC北安普顿分部的Twitter账户就发送了这样一条信息：

爆料新闻：特朗普总统在就职典礼上受枪伤。

10月4日，麻省理工学院的计算机科学与人工智能实验室（CSAIL）在其官方网站上发布了一则消息，声称该实验室与卡塔尔计算研究所的研究人员合作，开发了一个人工智能系统，该系统能够识别信息源的准确性，并且能够识别p.个人政治偏见。这项研究的结果将于本月底在比利时举行。布鲁塞尔举行的2018年自然语言处理经验方法会议（EMNLP）正式宣布。

研究人员使用人工智能系统创建了一个包含1000多个新闻源的开源数据集，这些新闻源被标记为真实性和偏见分数。据说，这是相似数据集中最多的新闻源。

研究人员写道，打击虚假新闻的一种（希望）方法是关注来源。尽管虚假新闻（帖子）主要通过社交媒体传播，但它们仍然有自己的原始来源，也就是说，一种，所以如果一个网站发布了虚假新闻，那么它很有可能在将来被发布。

人工智能系统的新颖之处在于它对所评估的媒体具有广泛的上下文理解。它并不仅仅从新闻文章中提取特征值（通过机器学习模型训练的变量），而是考虑维基百科、社交媒体，甚至基于URL和网络流量数据的结构来确定可信度。

系统的支持向量（SVM）训练用于评估事实和偏差。真实性分为：低、中、高；政治倾向分为：极左、左、中左、右、右和极右。

该小组表示，该系统只需要检测150篇文章，即可确定新源代码是否可靠，在检测新闻源是否具有高度、低度或中度真实性方面具有65%的准确率，在检测其政治倾向是左倾、右倾还是中立方面具有70%的准确率。

在上面显示的文章中，AI系统从六个维度测试了文章的文本和标题。它不仅分析了文章的结构、情感和参与(在本例中是股票数量、对Facebook的反应和评论)，还分析了文章的主题、复杂性、偏见和道德观念，并计算了每个特征值的得分，然后对一组文章进行了平均评分。

维基百科和Twitter也被添加到人工智能系统的预测模型中。正如研究人员所说，维基百科页面的缺失可能表明一个网站不可信，或者说提及这个问题的政治倾向可能是讽刺的或者显然是左倾的。此外，他们指出，信息公开不太可能。通过未经身份验证的Twitter帐户，或者使用没有明确标记的新创建的帐户，都是正确的。

模型的最后两个向量是URL结构和网络流量，它们可以检测试图模仿可信新闻源的URL（例如，foxnews.co），参考网站的Alexa排名，该排名是根据网站的访问总数计算的。

该小组在MBCF（MediaBiasFactCheck）网站上对1066个新闻源进行了AI系统培训。为了生成上述信息，研究人员在每个网站上发表了10-100篇文章（总共94814篇）。

正如研究人员在报告中煞费苦心地介绍的那样，并非每个特征值都能有效地预测事实的准确性或政治偏见。例如，一些没有维基百科网页或Twitter档案的网站可能发布公平可信的信息，而Alexa排名靠前的新闻来源并不总是更公平或更真实。比那些交通不那么拥挤的人更可信。

研究人员有一个有趣的发现：来自虚假新闻网站的文章更倾向于使用夸张和情绪化的语言，而左倾的媒体更倾向于提及公平和互惠。同时，维基百科页面较长的出版物通常更值得信任，包含少量特殊内容的URL也是如此。字符和复杂子目录。

将来，研究小组打算探索人工智能系统是否可以适应其他语言（目前只有英语培训）以及它是否可以被训练来检测特定领域的偏见。他们还计划推出一个应用程序，通过政治领域的文章自动响应新闻。

该论文的第一作者兼博士后助理RamyBaly说：如果一个网站之前发布了虚假新闻，他们很可能会再次发布它。通过自动从这些网站抓取数据，我们希望我们的系统可以帮助找出哪些网站可以首先这样做。

新德里的初创公司MetaFact使用NLP算法在新闻报道和社交媒体帖子中标记错误信息和偏见；SAAS平台AdVerify。AI去年发布了测试版来分析错误消息、恶意软件和其他有问题的内容，并交叉引用定期更新的数据库，该数据库包含数千个错误和合法新闻。

如前所述，一度陷入虚假新闻的Facebook已经开始使用人工智能工具来识别虚假新闻，最近收购了位于伦敦的初创公司Bloomsb.AI，以帮助其识别和消除虚假新闻。

然而，一些专家不相信人工智能能够胜任这项任务。卡内基梅隆大学机器人研究所的科学家迪安·波默洛在接受外国媒体的采访时告诉《边缘》杂志，人工智能缺乏对语言的微妙理解，这对于识别谎言和虚假陈述至关重要。

我们最初的目标是建立一个系统来回答，'这是假消息，是或不是，'他说，但我们很快意识到，机器学习不符合任务。

但是人类事实检验员并不一定比人工智能做得更好。今年，在保守媒体指责谷歌对他们有偏见之后，谷歌暂停了过去在谷歌新闻上贴的标签FactCheck。

然而，无论识别假新闻和个人偏见的最终解决方案是人工智能系统还是人为的，或者两者兼而有之，假新闻被消除的那一天都不会马上到来。

咨询公司Gartner预测，到2022年，如果目前的趋势保持不变，大多数发达国家将看到更多的虚假信息而不是真实信息。

上一篇: 黑洞的中心可能没有奇点

下一篇: 创历史最高！广东45个项目获国家科学技术奖，这些领域有了新突破

埃及埃及金字塔秘密：墓穴中笼罩着法老诅咒！

在非洲古国埃及的尼罗河边，开罗城近郊的广裹戈壁中，巍然矗立着一群宏大的方锥形修建物，这就是环球驰名的现代天下八大奇迹之首的埃及埃及埃及金字塔。它气概严肃，历经沧桑，迄今已有4、五千年的古代。它又是古埃及高度文化的意味，是人类迢遥古代的见证。...
印度火车和中国有什么不同?揭秘印度高铁的奇葩事情

我想但凡去过印度旅游过的游客们都知道，印度没有什么出众，唯一的就是人多，跟我们中国一样多的人口，但是土地却异常的少，这就是导致了印度火车站人满为患的原因！中国印度火车系统打不同候车大厅，坐的凳子与国内有很大区别，好像还是单个的小板凳，并不像...
蜗牛依靠两颗脑细胞做决定

科学家发现，蜗牛仅依靠两颗神经元就能做出复杂决定。腾讯科学讯据英国《每日快报》报道，科学家发现蜗牛能够依靠仅有的两颗脑细胞做决定。其中一颗脑细胞会告诉蜗牛是否饥饿，而另一颗脑细胞让它了解什么时候会出现食物。研究人员是在对寻找莴苣的淡水蜗牛...
999个世界未解之谜【十】

【第85谜】51区----位于美国内华达州南部林肯郡，东南方距拉斯维加斯市中心130公里。此区被认为是美国用来秘密进行新飞行器的开发和测试的地方，也因为许多人相信它与众多的不明飞行物有关而闻名。2002年，布什总统命令收回内华达州州政府管理...
澳大利亚Falkor号科考船发现“全球上最稀有的鲨鱼品种”短尾猫鲨Parmaturus bigus

澳大利亚Falkor号科考船发现“全球上最稀有的鲨鱼品种”短尾猫鲨Parmaturus bigus（qiwen818.com报道）据cnBeta：外媒CNET报道，大白鲨可能是鲨鱼全球中的“大明星”，但也有一些同样引人注目的小体型成员。在最...
最受人们欢迎的十种小动物快来看看你都养过没

导语：动物对于调节人类的情绪总能起到很好的效果，特别是最受人们欢迎的十种小动物，它们分别是小猫，小狗，刺猬，小鹿，小象，小鸭，小企鹅，小鸡，小熊猫，小长颈鹿，之前小编为大家讲解过世界上人气最高的十种动物，想了解更多的一起往下看吧!最受人们欢...
Alphabet推出新颖的“网格规模”架构彻底改变能源存储

Google母公司Alphabet的新分拆计划旨在通过依靠融盐和防冻剂混合物的新型电网规模架构来改革能源储存。在2017年首次成为马耳他项目后，Alphabet实验室X的毕业生现在是一家名...
三国赵云有后代吗谜团解读

根据史书记载，赵云的后代有三个人，其中有两个儿子，区别叫做赵统和赵广，还有一个女儿，姓名不详。其中赵统为长子，继承了家业，被封为虎贲中郎督，也就是赵云最初的军中职位，而次子赵广则尾随姜维，成为门牙将，征战沙场，最后不幸战死，小女儿赵氏则是嫁...
香妃真的确有其人吗？是否真的通体生香

香妃真的确有其人吗?她真的像传说的那样神奇，身体能发出异样的香味吗?在入宫前她真的嫁过人吗?她是被人从战场上掳来，最后被皇太后赐死的吗?　　香妃真的确有其人吗?她真的像传说的那样神奇，身体能发出异样的香味吗?在入宫前她真的嫁过人吗?她是被人...
帕尔帕考古公园发现巨型大猫地画有2000多年古代

秘鲁纳斯卡-帕尔帕考古公园发现巨型大猫地画有2000多年古代（qiwen818.com报道）据东网：秘鲁纳斯卡线的地画常吸引各国考古团队一探其奥秘，而文化部上周五（16日）又寻得另一画作。这次发现的是巨型大猫，更令人惊叹的是它有2000多...

AI系统：建立多维度向量进行数据检测

科学探索

今日最新

友情链接：美女图片 两性健康网 奇闻818手机版 说说大全 奇闻网 168图片网 z6新闻网 奇闻818 天下奇闻

AI系统：建立多维度向量进行数据检测

科学探索

今日最新

友情链接： 美女图片 两性健康网 奇闻818手机版 说说大全 奇闻网 168图片网 z6新闻网 奇闻818 天下奇闻

友情链接：美女图片两性健康网奇闻818手机版说说大全奇闻网 168图片网 z6新闻网奇闻818 天下奇闻