导读
AI 能自动验证新闻真假,还能自动分发内容,但是却很难给出新闻事实背后的真相。在美国,有人还靠虚假新闻赚到了钱。
刺猬公社丨石灿
昨天上午,89岁的褚时健“被死亡”了。 他是中国最具有传奇色彩的企业家之一,生涯经历大喜大悲,晚年在云南创建了“褚橙”,产品远销国内外。
褚时健“被死亡”的信息来自中国金融博物馆理事长王巍的微博,之后,各大媒体开始竞相转载,狂刷朋友圈。
《云南信息报》记者李多(化名)在一个记者群看到这条消息,“很震惊,和同行讨论了一下都觉得太突然了”。
他在网上搜索相关新闻,发现那条信息是新浪发的,他觉得不简单。出于记者的本能,“第一反应还是核实此事,在同事和褚老的家人取得联系后,发现(消息)失实。”
《云南信息报》立即在微博上发布消息:“云南信息报社记者与禇时健身边工作人员进行了联系,该工作人员表示:目前禇时健先生安好!”
褚时健在家
另据红星新闻报道,褚时健身体非常好,今早还在菜市场走了一小时买菜。
没过多久,王巍自己发布了辟谣微博,并作解释:“早上在群里看到褚时健老去世的消息,很突然也很痛惜,便在微博上转发哀悼。后被告知是误传,即刻删除。”
一场闹剧就这样结束了,但李多还是觉得“那些转发的媒体,居然也不核实下,根本不专业”。褚时健“被死亡”属于突发,从这个新闻的传播路径来看,记者直接采访到与当事人亲近的人,是最为有效的办法。
但对于其他的吃瓜群众来说,如果没办法去核实,又心存疑虑,有办法核实信息的真假吗?答案是肯定的。随着人工智能技术的发展,用AI来鉴别信息真假在技术上越来越成熟,相信在未来会逐渐开放给普通用户。
“新闻追踪者”阻击谣言
路透社在几年前就开始在AI+新闻业上做了探索,推出了一款名为“新闻跟踪者”(News Tracer)的产品,这款产品是一个监测社交媒体的工具,最早用于路透内部,帮助记者和编辑监测社交媒体中出现的新闻信源。
后来随着算法的深入,路透社的研发人员发现这款产品还可以做更多事情,比如对社交媒体上发出的信息进行监测,通过算法分析出哪些是新闻,哪些是一般性对话。
这个产品之前一直都处于内部使用范畴,经过三四年的不断优化,现在正逐步测试开放给外部用户使用。
最近,在网易新闻举办的“人工智能将如何重塑新闻业”沙龙上,路透社市场开发经理王海明透露,前不久,他亲历了一则谣言从发布到爆发的传播过程。最开始,他在社交软件上发现了一条可疑的信息,于是,他用“新闻追踪者”对那条信息进行检测,发现是假消息。
王海明
慢慢地,那条消息在网络上开始传播开来,点击数在很短的时间里增长到了800多,大V和媒体开始转载,转载量和阅读量都还在增加,但不到24小时,那条新闻就被澄清了,是假新闻。
“我收到第一新闻源特别早,整个假消息传播链条一开始局限在小范围内,随着新闻网站的转发和大V转发而爆发。”他说。
“新闻跟踪者”能够对Twitter上搜集起来的所有可能视为新闻的内容做分析:是谁最先发出消息的;是谁最先转发的;做信息交叉分析;信息的可信度如何。如果分析结果判定消息的真实性存疑,就会在上面标注出来相应的从0%到100%的可信度数值。
“新闻跟踪者”目前有以下四个特点:
1. 自动验证新闻真假,它会用算法去分析记者平时可能会关注的问题,去验证新闻的真实性。
2. 通过算法和机器学习剔除广告、垃圾、谣言、一般性谈话等无用信息,摘出要点。根据不同的数据源确定它的真实程度有多高,同时它能够去除噪音,而且会把相同类别的叠在一块儿,作为一个数据组,同时显示未来的更新。
3. 这个工具处于实时监测的状态,随时验证Twitter和其他社交媒体上的新闻。
4. 后台有大数据库,用户可以根据自己的需求来搜相关新闻,分辨真假。
传统意义上的人工智能应用都是在内容分发端,而“新闻追踪者”是从新闻来源一端做了工作,在大数据、人工智能、机器学习方面都有应用。
同样对虚假信息保持高度警惕状态的腾讯新闻,在去年专门推出了一档名为《较真》栏目,做新闻查证。一年来,平台已推出13个辟谣报告,已辟谣内容超1万条,阅读人次超过3亿次。不过,这档栏目的内容多为人工书写,工作量很大。
作为目前最火的社交软件,微信则通过公众平台辟谣中心、微信辟谣助手小程序等多个系统工具,处理谣言信息。2017年初至今,微信第三方机构已拦截100余万篇谣言文章,处罚公众号数量约4.5万个,已有超过600家权威机构加入微信辟谣中心。
昨日,腾讯携手中国科协将推出 “慧眼行动”,计划通过两年的时间,分批次引入各领域千余名专家入驻腾讯辟谣平台,积累辟谣数据,通过机器学习,形成有效算法,欲打造人工智能谣言识别系统。
在“人工智能将如何重塑新闻业”沙龙上,中山大学传播与设计学院院长张志安说,在近两年的时间里,中山大学大数据传播实验室已经建立了30万左右的网络谣言库,通过海量文本挖掘,分析数据文本,逐步建立网络谣言的智能识别模型。
有了社交媒体的谣言库之后,他们的研究团队开始尝试建立一个关于识别谣言的工具分析模型,一旦成熟,它能够跟一些平台媒体结合,未来在智能化识别谣言、辟谣方面会发挥更高效、更有精准的作用。
AI无法解释事实
2016年,在美国总统竞选期间,Facebook、Twitter 、Google 上出现了很多耸人听闻的假新闻,那时,假新闻开始展现出其巨大的威力。
在此之前,一个叫贾斯汀·科勒的人开设了一个假新闻网站,从中获取了巨大的经济收益,他的假新闻一度影响到了整个美国新闻业态,在美国,有媒体称他为“假新闻”教父。
科勒的LinkedIn的资料说他曾经出售订阅杂志,做过数据库管理员工作,是一名自由撰稿人。从2012年末,2013年初,他开设假新闻网站,撰写假新闻,一开始,他的目的很简单,想通过撰写一些虚假的新闻来回击另一些虚假的故事。
他很惊讶,假新闻的传播速度非常之快,而且人们很容易相信这类新闻。尤其在美国大选期间,这类新闻受到川普支持者们的欢迎,在Facebook等社交网络上大肆传播。
科勒的网站,也因此从社交网站上获得大量流量,夸张的程度到了在10天内,他的网站有获得了160万个观点。他雇佣了20多名写手,通过广告主在网站上投放广告来获得收入。科勒不愿透露公司的情况,但他说其他假新闻网站的写手通常每月能进账1万~3万美元。
科勒还是一家名叫Disinfomedia的公司的负责人,他旗下的网站通过这个公司周转资金,Google曾是他的一个广告主。Google投放广告的策略是通过Doubleclick(美国一家网络广告服务商)的数据库了解到网站浏览群体的性别、年龄等信息。对Doubleclick而言,不管网站的内容是什么,只要符合广告主要求就会投放。
不过,在假新闻愈演愈烈之后,Disinfomedia旗下的一个网站National Report(国家报告)被Google 标记为了“假新闻源”,Google停止给网站接入新闻源,切断从Google引来的流量。
目前还能搜到的NationalReport网站(中文翻译版)
可这类假新闻网站拥有大量的点击率,根本不用发愁缺广告主的问题。科勒透露Google只是他们其中一个广告主,除此之外,他们还有更多的选择。
他的行径被NPR(美国国家公共电台)通过外部专业力量的协助查了出来,并和他直截了当地聊了聊。不过假新闻确实很赚钱,他对NPR说,“这可能是我最后一次假新闻商业,但我可以向你保证,它不会消失,它甚至会逐渐变大”。
中国人民大学新闻学院教授宋建武对“假新闻的产生”做过分析,他在一篇名为《人工智能是虚假新闻的“克星”》的文章中写道,虚假信息及低俗内容,在互联网环境中跨地域大规模快速传播的现象,主要出现在拥有海量用户的互联网应用平台产生以后。每个用户都可以在这个平台上发布信息,并在平台内部和平台之间快速传播信息。
在一定的利益动机和社会心理机制作用下,一些平台用户试图发布虚假信息及低俗内容谋取各种利益。由于这类信息和内容往往流传甚快甚广,使得社会原有的甄别及防范机制难以及时做出反应。
面对这些问题,他认为是可以解决的,而且有多种思路。比较传统的方法,诸如提高公众传播素养,更多发挥传统媒体把关功能,加大对虚假信息及低俗内容发布者的处罚力度,加重平台责任等。
但是纽约大学斯特恩商学院的副教授达伦·康魄则告诉Fox News(福克斯新闻),人们还可以通过在假新闻制作中使用谨慎的语言来操纵AI系统。康魄说:“假新闻通过将‘事实’嵌入到可以防护的方面来保护自己。”
虽然AI系统可以有效地识别事实是不正确的,但是在识别该事实的背景上可能起不到作用。张志安的观点和康魄副教授的观点相似,前者认为,人工智能无法带来真相,真相不是表面事实,是掩藏在事实背后的事实。
以调查性报道为例,机器无法看到表面事实背后错综复杂的利益链条,无法像调查记者一样找到谁施害、谁造假、谁是复杂事件后的作恶者,事实背后被遮蔽的事实,机器是无法有效获知的。
“而且事实与事实的联系,我们叫‘有意义脉络的事实’,这才是所谓的真相,它无法被机器捕捉。”张志安说。
新闻事实出来之后,必然要放在复杂的社会情境中进行解释。人们看新闻,不仅要获知事实,更重要的一点,是要看到它背后的东西,理解它到底对我们意味着什么。
从这个角度看,张志安觉得,机器能呈现关于事实的信息,却无法解释事实,帮助我们去理解事实的意义。“而人最大的价值就是对事实的判断,和对复杂逻辑关系的推理。”
AI+新闻业现状:压力与慌乱并存
去年,网易新闻对内容编辑的工作进行了调整,很多编辑的工作,从给文章取标题、分发内容,变成了给文章打标签、选关键词,他们原来的工作被机器取代了,“成为了机器的辅助。”姚窈(化名)说。
当时,她和她的同事都感觉不舒服,甚至滋生了一些负面情绪,但是做的时间久了,也就觉得无所谓了。
像姚窈那样的人不少,自从今日头条开启了内容算法分发时代,网易新闻、腾讯新闻、天天快报......等等新闻资讯平台都加入了算法分发行列,编辑成为了帮助机器学习内容知识的“工具”。
搜狐创始人张朝阳曾公开说,2016年搜狐将会原创和自媒体并重,今年1月又成立了“内容获取中心”,与原创中心并列。2017年开始,搜狐的垂直频道和部分地方频道改为机器推荐。而搜狐的编辑们不少已经离职,还有人转去参与开发房地产类新产品。
今年6月份,传统门户中流量最高的腾讯网,对整个旗下媒体内容业务——网络媒体事业群(OMG)做出巨大调整,打散了过去的频道制度,提升了运营部门对内容分发的掌控权,矛头直指今日头条。
人工智能技术正在重新塑造着新闻业,谣言辨别技术、内容只能分发、用户信息获取......看似欣欣向荣,实则AI+新闻业的现状是压力与慌乱并存。
新华网融媒体未来研究院副院长鞠靖在“人工智能将如何重塑新闻业”沙龙上透露,他在研究调查中发现,部分做人工智能的技术人员不了解新闻业,很多媒体人同样也没有认真地研究人工智能,但大家都很焦虑地谈论着人工智能。
鞠靖
一方面,面对人工智能的发展和新闻行业的竞争压力,“记者会被机器取代”的问题一再被人们提及,似乎迫在眉睫了。另一方面由于技术进步、媒体转型、新兴媒体崛起等原因,媒体自身压力很大。
“在写作编辑领域,人们对于机器写稿过度神化。”他说,机器人确实能在财经、体育等个别领域帮助我们写作,但在提高效率、节约成本方面,乃至提高传播效果方面究竟有多大的作用,还是值得探讨。
他提醒媒体从业人员,耶鲁大学、牛津大学对352位人工智能专家采访后发现,可能要到2026年,人工智能才能达到高中水平的写作能力。单就写而言,10年内记者被替代的可能性不大。
现在,整个行业仍旧在探寻适合这个时代发展的方式,新闻业也确实正在被人工智能所改变,从信息采集,到内容分发,再到用户情绪分析。
人工智能到底能给当下新闻业带来什么?张志安认为,它带来了新的速度、新的体验与新的分发,但它却不能带来真相与解释;未来要在物联网和互联网的交织中探索其实践,直面技术和人文的关系挑战。