澳门新葡亰平台官网-澳门新葡8455最新网站
做最好的网站

您的位置:澳门新葡亰平台官网 > 中国史 > 中外数据新闻实践现状与比较研究,大数据时代

中外数据新闻实践现状与比较研究,大数据时代

发布时间:2019-08-17 18:50编辑:中国史浏览(74)

    如何将大数据中有价值的信息变成新闻报道,考验着新闻传播行业对信息的整理和意义的挖掘。数据新闻报道是否真能取代传统新闻报道,数据新闻是否永远真实和安全,数据新闻是否弱化了新闻专业标准等问题,尚未被学界集中关注。

    [摘要]在大数据时代,数据新闻可以实现对信息更明晰的呈现、更准确的分析和更深层的解读,正逐渐成为一种主流新闻报道方式。本文结合《卫报》等国外代表性媒体的数据新闻报道,学习借鉴他们的经验与方法。《卫报》在网站上开辟“开放新闻”和“新闻博客”栏目,对于突发事件的报道,采用滚动的方式,将读者在社交媒体上对事件的文字报道、图片、视频,甚至通过电子邮件发来的评论,全部整合到一起,成为报纸网络上不断更新的报道的一部分,编辑部门再根据读者的反馈和评论。国外数据新闻的制作团队数据新闻同传统新闻报道的诸多差异,造成了数据新闻制作团队的人员组成也大大区别于传统的新闻报道。

    原文  http://datameng.com/info/2014/03/big-data-xinwen-caibian/

    据统计,到2013年,全世界储存的信息如果记录在光盘上,再把这些光盘叠加起来,高度等于从地球到月球的距离。美国互联网数据中心指出,目前世界 上90%以上的数据是近几年才产生的。互联网上的数据每年将增加50%,每两年翻一番。因此有学者认为,人类进入了大数据时代。一般意义上,大数据是指无 法在可容忍的时间内用传统IT技术和软硬件工具对其进行感知、获取、管理、处理和服务的数据集合。[1]业界将大数据的特点归纳为4个“V”,即 Volume(数据量大)、Variety(数据类型多样)、Velocity(数据生成快速)和Value(数据价值大但密度低)。

    2012年3月22日,奥巴马宣布美国政府投资2 亿美元启动“大数据研究和发展计划”,将大数据研究上升为国家意志,大数据成为了全球热门话题。其实大数据并非一个全新的事物,麦当劳、Zara等大公司 早就通过数据跟踪、挖掘分析为企业营销提供服务。近年来随着数据积累越来越丰富,上述技术和工具开始从商业领域向其他领域延伸,传媒业也是其中之一。

    数据新闻的最终目标是为受众带来有价值的报道,即为受众提供其想要了解而无法获得、能揭示某些联系和变化的内容。数据新闻 可视化 交互性 比较研究数据新闻(data Journalism),又称为“数据驱动新闻”(data-driven journalism)

    完胜;整理;新闻记者;新闻传播;公开

    数据新闻;报道;卫报;媒体;团队;地图;分析;处理;制作;网站

    一、大数据时代新闻生产的变革

    在新闻报道中使用数据,以增强报道的说服力和趣味性,可谓由来已久。20世纪60年代兴起的“新新闻学”主张抛弃传统新闻写作禁忌,利用小说写作技巧进 行新闻报道。许多记者、学者则不以为然,菲利普·迈耶针锋相对地提出了“精确新闻”思想,他认为记者在报道新闻时,应该灵活运用调查、内容分析等社会科学 研究方法收集和分析数据,以查证事实,最大限度地避免报道的主观性和可能的错误。精确新闻理论在20世纪70年代风行于美国新闻界,后来又先后影响到世界 各国新闻界。20世纪70~80年代,计算机技术的迅速发展和普及,精确新闻报道中的数据收集、处理和分析任务越来越多地由计算机辅助完成,精确新闻学由 此提升为“计算机辅助报道”。特别是20世纪90年代以来互联网的迅猛发展,极大地扩展了计算机辅助报道的能力和范围。

    基于大数据的“数据新 闻”明显不同于计算机辅助报道,可以说是后者在互联网时代的升级版。数据新闻分析的对象是海量的大数据,而计算机辅助报道往往基于有限的数据集;在计算机 辅助报道中,收集和分析数据只是加强新闻报道的一种辅助方式,而在数据新闻中,使用数据不是一种手段,整个新闻工作流程是围绕数据的收集、挖掘和解释展开 的。传媒业本身就是信息产业,在大数据时代拥有先天优势。肯锡全球研究所2011年对美国17个行业拥有的数据量做了估算,离散式制造业拥有的数据量居首 位,共有966PB(拍字节);美国政府列第二位,数据总量达848PB;传媒业居第三位,共有715PB数据量。[2] 近年来大数据的急剧膨胀主要来自于网络营销、社交媒体等基于互联网的服务。大数据的飙升催生了数据新闻等新的报道模式,必将给新闻生产带来巨大变革。

    传统的新闻生产流程一般是线性的,记者获取新闻线索后,自行收集相关信息,确定报道方向并实施采访,然后根据获得的新闻素材提炼报道主题,撰写稿件。新 闻编辑在对稿件进行编辑加工后,提交出版部门发表,新闻生产就此完成。在这个过程中,新闻信息的流动是单向且不可逆的,新闻报道的真实性和精确性取决于记 者的识见和编辑的把关。传统新闻业条块分割繁复,记者获取信息的渠道单一,导致对反映全局性态势和规律的报道表现乏力。基于大数据的数据新闻则可以弥补这 一缺陷,经过挖掘和分析的大数据不仅可以展现宏观新闻事实,而且可以更加客观、准确地揭示新闻事件发生的原因,往往比记者观察和采访所得的结果更准确、更 具说服力。2011年英国伦敦骚乱爆发后,英国政界一度将骚乱归罪于Facebook(脸谱)、Twitter(推特)等社交媒体,英国《卫报》记者搜集 了骚乱发生地点信息和伦敦各地区经济指标信息,通过数据可视化方式,在地图上标出骚乱发生的地点,用不同的色块标示伦敦各区的经济状况,发现骚乱发生地点 与当地的贫困程度有关。《卫报》记者还对Twitter信息进行内容分析,发现Twitter并非只是传播谣言,相反在纠正谣言方面发挥了积极作用。《卫 报》的数据新闻批驳了英国政界对社交媒体煽动骚乱的误解,揭示了骚乱发生的深层次原因,显示了数据新闻报道的优势。 
    在传统新闻生产的线性流程 中,新闻信息是从媒体到受众的单向流动,媒体处于新闻信息流动的上游,对新闻价值的判断、对新闻事件的解读往往依赖记者编辑的经验,很难顾及受众的个性化 需求。数据新闻强调用户体验,追求新闻信息传播的互动性。数据新闻要解读数据分析的结果,以引导受众理解新闻事实,但这种解读不是唯一正确的答案,也无法 包容数据的全部信息。数据新闻通过可视化方式将数据展现出来,鼓励受众从中寻找自己感兴趣的信息,并对之进行个性化的解读。基于互联网的交互式图表在这方 面堪称典范,英国《卫报》2011年10月制作了一幅关于政府各部门开支的交互式图表,将政府各部门的开支按比例以气泡的方式在图上展示出来,点击后可以 通过缩放效果看到不同部门之间花费的对比。受众可以选择自己关注的政府部门进行比较,做出自己的判断。

    数据新闻正式将数据收集、数据分析、数 据可视化等环节引入新闻生产流程,与之相适应的新闻编辑部的人员组成也会发生相应变化。在传统新闻生产中,数据的使用并不是必须的,处理数据图表是美工部 门偶尔的工作,而在数据新闻生产中,收集和分析数据、数据的可视化是经常性的工作,而且居于核心地位。《卫报》、BBC(英国广播公司)、《芝加哥论坛 报》、ABC(澳大利亚广播公司)等数据新闻的先行媒体都成立了专门的数据新闻团队,这些团队一般由记者、编辑、信息设计师、数据研发人员等组成。数据新 闻的诸多成功范例都是专业团队精诚合作的结果,光靠记者编辑的单打独斗是很难胜任数据新闻的报道任务的。

    内容摘要】数据新闻的最终目标是为受众带来有价值的报道,即为受众提供其想要了解而无法获得、能揭示某些联系和变化的内容。我国数据新闻实践虽有自己的特色,但仍存在一些问题:数据获取渠道狭窄;主要关注政治、经济领域,很少关注民生;制作形式单一,以静态信息图表为主,缺乏动态形式与互动等。

    提要:如何将大数据中有价值的信息变成新闻报道,考验着新闻传播行业对信息的整理和意义的挖掘。数据新闻报道是否真能取代传统新闻报道,数据新闻是否永远真实和安全,数据新闻是否弱化了新闻专业标准等问题,尚未被学界集中关注。

    摘要:在大数据时代,数据新闻可以实现对信息更明晰的呈现、更准确的分析和更深层的解读,正逐渐成为一种主流新闻报道方式。本文结合《卫报》等国外代表性媒体的数据新闻报道,学习借鉴他们的经验与方法。

    二、数据新闻对新闻从业人员的要求

    面临大数据时代的挑战,新闻从业人员除了要熟练掌握文字、图像等传统技能外,还要具备收集数据、分析数据和解析数据的能力,才能顺利进行数据新闻报道。 
    1.收集数据能力

    数据新闻的报道方式大致有以下两种:①发现新闻线索、确定报道主题后,根据新闻主题寻找相关数据;②从已有的大数据中发现新闻线索,提出问题。不管使用 哪种方式,获取大数据是数据新闻报道的基础。数据新闻报道所使用的数据主要来自两个方面:①从政府、企业、媒体等机构的数据库中直接或申请获取的二手数 据;②媒体自行抓取或调查获得的一手数据。媒体本身就是大数据的重要来源。传统媒体经过多年积累,已经拥有大量内容资源,但这些资源大多以报纸版面、录音 带、录像带等方式保存,尚未进行数字化并建立相关数据库。更重要的是,传统媒体内容资源往往缺乏与受众互动的记录,这就不可避免地会限制数据报道的效力。 传统媒体应该积极建设多功能、综合性的数字化平台,增强与受众的互动,并建立专门的读者数据库。2012年4月,浙江日报报业集团发布公告宣称,斥资32 亿元收购边锋浩方网络平台,该平台拥有500多款游戏,活跃用户达2000多万。无独有偶,同年11月,美国赫斯特传媒集团宣布对Spooky Cool Labs(怪酷研究室)社交游戏公司进行股权投资。两家传媒集团不约而同地选择网络游戏作为其内容产业延伸的新方向,看中的正是网络游戏平台对互动性数据 的收集和积累,及其在数据新闻、数据库营销等方面的开发价值。

    政府是大规模数据的原始采集者,而且这些数据大都关乎国计民生,是数据新闻报道 的重要数据来源。在中国现行体制下,政府在获取数据方面的能力甚至比美国政府更强,但在数据公开方面做得还不尽如人意。美国奥巴马政府开设专门网站 (Data.gov),向公众提供联邦政府数据。英国政府的政务大数据公开项目(Data.gov.uk)也相当成功,澳大利亚、新西兰等国都相继建立了 政府数据网站。我国一些部门和机构虽然拥有大量数据,却不多与社会公众分享,导致数据新闻报道中政府数据获取不足。为此,一方面,政府应通过机制改革打破 数据割据与封锁,重视信息公开;另一方面,新闻记者编辑应该了解档案管理、公开的相关法律规定,加强与政府部门的沟通,在获取数据的前提下,尽可能帮助政 府提高决策和管理水平,力争达到双赢的效果。

    除了从政府、媒体、企业获取二手数据外,数据新闻从业人员还应具备从互联网收集所需数据的能力。 最常用的方法是通过搜索引擎,采用关键词搜索的方式获取相关数据,也可以运用现有的或开发特定的数据抓取工具,从网页直接抓取所需要的数据。众包 (crowdsourcing)是最新出现的数据收集方法,这种方法以互联网为平台,将数据收集任务分割后,发动受众参与完成,目前还处于试验阶段。

    2.分析数据能力

    大数据是数据新闻报道的重要资源,但这并不意味着数据新闻就是大数据的堆积,必须对大数据进行准确的分析,才能从大数据中挖掘有价值的新闻信息。因此, 数据新闻从业人员必须具备分析数据的能力。数据虽然是数据新闻的核心,但数据新闻从业人员应该对数据保持谨慎态度,切不可盲从数据。大数据来源多样,质量 也良莠不齐,数据新闻从业人员首先要对所获取的数据质量进行评价,评估数据来源是否可靠、数据收集方法是否科学、数据是否具有时效性。然后对数据进行校 核,去除冗杂的、干扰性的数据,清理数据中的误差,并将数据转换为统一可处理的格式。

    对数据的前期处理完成后,下一步就是对数据进行挖掘分 析,这就要求数据新闻从业人员具备数据库设计和管理能力、统计分析与建模能力、网络工程与分析能力,从大数据中发现具有新闻价值的信息。数据新闻通过数据 分析呈现新闻事实,比传统新闻报道更具可信度。尽管并非所有的数据新闻记者编辑都要具备上述能力,但数据新闻记者编辑都有必要理解数据分析的方法和意义。

    数据新闻从业人员还要具备数据可视化能力。数据本身是不可见的,数据可视化可以将数据分析的结果以直观可见的方式呈现出来,吸引受众观看,并引导读者从 中挖掘更深层的东西。数据可视化具有强大的认知优势,因为人类大脑的一半是用于处理可视化信息的,一幅设计精妙的数据可视化图表能够穿透纷繁芜杂的信息直 达问题的核心,给受众留下难以泯灭的印象。而且数据可视化图表与图像、视频等视觉媒体相比,更少受主观情绪的影响,更客观可信。常见的数据可视化方式有表 格、数据图、地图和网络图谱等,一般需要通过专门软件制作实现,因此数据新闻从业人员还应掌握数据可视化软件的操作和编程技术。

    3.解读数据能力

    数据经过挖掘分析和可视化后,数据新闻报道还没有完成,因为大数据挖掘分析的结果数据量往往比较大,数据新闻记者还应该对结果进行必要的解读,以引导受 众理解新闻信息,并对数据分析结果进行个性化解读。传统新闻记者也常常扮演新闻信息“解读者”的角色,只是他们解读新闻信息所依据的是个人的认知和经验。 数据新闻记者对新闻信息的解读同样离不开自身的认识和经验,但这些都不如数据来得客观可信,因此数据新闻记者应该把对数据的解读放在首要位置,但也不能抛 开传统的经验和技术。数据记者解读数据的能力应该体现在对社会环境和新闻事实的全面经验的基础上,从数据分析结果中提炼出有新闻价值的信息,并做出合乎逻 辑的解析。

    对数据的解读实质上是对数据中变量之间关系的揭示。《大数据时代》的作者舍恩伯格认为,大数据时代对数据的解读,应该寻找变量之间 的相关关系,而不是因果关系。[3]这在市场营销、工程技术等应用领域无可厚非,因为在这些领域只要发现两个现象之间存在显著的相关关系,就可以创造巨大 的经济效益,而不必弄清楚现象之间可能的因果关系。但在新闻传播领域,对新闻信息的解析止步于相关性层面是不够的。在现代社会,人们很容易知道“发生了什 么”,可能更关心的是“为什么发生”的问题,新闻传播的独特性和社会使命规定了数据新闻不能放弃对因果关系的探求。大数据一般由彼此之间存在弱关系的数据 点构成,正如麻省理工学院教授克劳福德所指出的,大数据的研究方法只能统计某件事情发生的频率和相关性,但不能得出因果关系。将大数据策略和小数据研究相 结合也许是更好的科学研究途径。[4]因此,数据新闻解读数据的方向应该是在对大数据相关性分析的基础上,进一步探讨可能的因果关系。

    关键词】数据新闻 可视化 交互性 比较研究

    关键词:大数据新闻 传统新闻 数据新闻

    关键词:数据新闻 数据来源 展现形式

    三、数据新闻职业能力培训是当务之急

    有人认为,中国大数据研究起步不久,数据新闻报道在近期内发展的可能性不大。这种观点是非常短视的,数据新闻报道本身在全球尚处于探索阶段,还未形成固 定的模式,我国新闻界应该紧紧抓住这个历史机遇,参与全球数据新闻的研究与实践。况且,我国新闻业发展数据新闻的外部条件已渐趋成熟。大数据的收集和积累 已初具规模,以互联网为例,新浪微博用户每天发的微博数量超过1亿条,百度每天要处理几十亿次搜索请求,淘宝网每天发生数千万笔交易,联通用户的上网记录 一天就达10TB(太字节)……这些大数据的积累为数据新闻报道提供了条件。国内有些新闻网站已经开设专门的图表新闻栏目,比如新浪的“图解新闻”、搜狐 的“数字之道”、网易的“数读”等,虽然略嫌简单粗糙,但引起了网民的广泛关注。有些平面媒体也开始了类似的探索,说明新闻业界已经开始尝试数据新闻报 道。

    数据新闻报道要求新闻从业人员具备收集、分析和解读大数据的能力,这些能力是传统媒体记者编辑所缺乏的。英国《卫报》、BBC等探索数据 新闻的先驱媒体的做法是在传统媒体编辑部成立专门的数据部门,引进数据分析人才,让他们跟记者编辑一起工作,通过团队合作进行数据新闻报道。专业数据分析 人员精于与数据打交道,大多对政治、社会、经济问题了解不深,对新闻信息不够敏感,而这方面恰恰是新闻记者编辑的长项。新闻记者编辑如果缺乏数据素养,不 理解数据挖掘和分析的原理和方法,就无法从数据分析结果中洞悉有价值的新闻信息,并对之进行准确的解析。两者不但要精诚合作,而且要加强沟通,增进对各自 工作的了解,才能做出高质量的数据新闻。

    数据新闻报道是一个综合性的工作,一般需要团队合作完成,能够熟练掌握数据新闻报道各技术环节的“全 才”可谓凤毛麟角。在数据新闻报道中,要求新闻记者编辑掌握数据收集和分析技术,独立完成报道,几乎是不可能的,也是不现实的。但如果新闻记者编辑缺乏基 本的数据素养,数据新闻报道也很难展开。因此,数据新闻记者编辑应该了解数据处理的原理和方法,并尽可能参与其中,而不必成为这方面的专家。

    数据新闻是一种全新的报道方式,而传统新闻业界普遍缺乏数据素养是不争的事实,对新闻记者编辑进行适当的数据素养培训是当务之急。新闻院系的学生是未来的新闻从业人员,也应该纳入培训体系中。数据新闻职业能力培训可以分下列两个层次进行:

    1.新闻院系应增设数据新闻类课程

    2012年4月,奈特基金(Knight Foundation)和陶氏基金(Tow Foundation)联合授予哥伦比亚新闻学院200万美元研究经费,用于数据新闻的研究和教学工作。[5]乔治-华盛顿大学媒体和公共事务学院今年制 定的下一个五年规划中,数据可视化和其他多媒体技巧列入了教学课程。美国公共广播公司“新闻一小时”的前任高管切尔斯称:“有实力的大型媒体机构需要现在 的大学毕业生具备处理大量数据的能力,而几年前,这还不是新闻记者的分内工作。”[6] 可见,新闻院系增设数据新闻类课程,有来自业界的压力。从美国已经开设数据新闻类课程的新闻院系来看,师资大都来自于业界。哥伦比亚大学数字新闻学项目主 管艾米丽·贝尔2010年加入哥伦比亚大学之前,是英国《卫报》网站数字内容主编。哥伦比亚大学新闻学院已经开设的数字新闻概论性课程,由来自《华尔街日 报》互动团队的苏珊·麦克葛瑞格主讲。对于数据新闻的实践探索,业界已经走在前面,新闻院系从业界聘请师资是明智之举。

    国内有些新闻院系已经 将数据新闻课程提上了日程,专业师资的紧缺应该是一个比较突出的问题。由于国内新闻业界数据新闻报道才刚刚起步,很难提供一定数量的合格师资。传统新闻教 学计划中涉及数据新闻方面的课程较少,有些新闻院系甚至没有开设统计学课程。尽管如此,国内新闻院系应该积极创造条件,可以将现有的相关课程培育转化,从 其他院系引进人才和课程,尽量将数据新闻类课程先开设起来,并在课程教学过程中进行整合提升优化。

    2.新闻业界应重视数据新闻业余培训 
    面对数据新闻的挑战,新闻记者编辑的数据素养亟待提高,新闻业界应重视对之进行有针对性的业余培训。业余培训的形式可分为自学和短期集训两种。新闻记者 编辑都有自己的本职工作,采用自学的方式比较灵活。只是目前适合媒体记者编辑水平的数据新闻自学资料比较少,可以从最基本的方法、最易得的工具出发,循序 渐进地自学相关知识和技术。数据的整理和审校方面,可以从Excel(电子表格)开始学习,很多人的电脑中有这个软件,而且关于Excel的书籍资料很容 易找到,入门比较容易。Google Charts(谷歌电子图表)软件简单易学,初学者容易上手,可以用来创建简单的线图和饼图。对地理数据的可视化,初学者可以从Google Fusion Tables(谷歌融合图表)和Tableau Public(公共场景)两个软件入手,后者不但是免费的,而且有一些很好的网络教程可供参考学习。在图像处理方面,Photoshop(图像处理软件) 是常用的工具,很多人可能已经掌握了基本的操作,可以根据需要自学其他功能。数据处理方面的工具很多,数据新闻记者编辑要善于发现和学习适合报道需要和自 身水平的方法和工具。媒体主管部门和行业协会应该牵头,联合相关新闻院系和专业公司,开发有针对性的、多层次的数据新闻在线教程,供新闻从业人员免费自 学。

    鉴于媒体记者编辑的知识结构,有些知识和技术很难完全通过自学获得,有必要通过短期集中培训找到入门的路径。媒体应该与新闻院系合作开设 与数据新闻报道有关的、各个层次的短期集训班,重点解决那些自学中一时无法解决的问题。短期集训应该打破学科的藩篱,积极从其他学科聘请合格的师资,整合 学界和业界的资源,打造数据新闻记者编辑进阶提升的平台。数据分析是数据新闻报道的重要环节,这就要求数据新闻记者编辑从理论层面了解统计学基本原理,数 据挖掘分析的基本方法及其局限性,因此短期集训应该首先开设此类基础理论课程。其后可以开设各种应用课程。在数据收集方面,可以从Whois(域名查询服 务)、Blekko(搜索引擎)等网页工具开始,教授简单的数据抓取方法;在数据管理方面,可以开设MySQL、Access等数据库应用课程,用以处理 比较庞大的数据集;数据可视化软件较多,可以选择Datamarket(数据市场)、Many Eyes(千眼)等常用工具集中辅导,以取得举一反三的效果。当短期集训到达一定层次后,还可以根据需要开设一些涉及数据分析工具的算法和编程的高级课 程。

    数据新闻职业能力培训的目的不是为了让每个记者编辑都成为数据挖掘和分析的专家,但这类培训确实是必不可少的。数据新闻记者编辑的数据素 养越高,就越可能做出优秀的数据新闻报道。因此,新闻媒体为应对大数据时代新闻生产的变革,对新闻采编人员的数据新闻职业能力培训刻不容缓。 
    (作者单位:南京大学新闻传播学院)

    *本文系2012年度教育部人文社会科学研究青年基金项目“基于互联网的传播内容分析法:理论、方法与应用”(12YJC860020)的研究成果之一

    注释: 
    [1]李国杰, 程学旗. 大数据研究:未来科技及经济社会发展的重大战略领域——大数据的研究现状与科学思考[J]. 中国科学院院刊, 2012,(06) 
    [2] McKinseyGlobalInstitute. Big Data: The next frontier for innovation, competition and productivity [R]. 2011 
    [3]维克托·迈尔-舍恩伯格, 肯尼思·库克耶. 大数据时代[M]. 盛杨燕, 周涛译. 杭州: 浙江人民出版社, 2013 
    [4] Crawford K. Think Again: Big Data[EB/OL].
    [5] New research effort at Columbia University seeks best practices for digital reporting[EB/OL].  . 
    [6]美国高校将教授数据处理知识应对新闻业变革[EB/OL].

    数据新闻(data Journalism),又称为“数据驱动新闻”(data-driven journalism),这一概念发端于新闻实践领域。①目前关于数据新闻的定义尚未有统一标准,但学界对“数据新闻”表现出很大的兴趣。国内外学者从新闻内容、生产流程、相关技术及与用户关系等方面进行了阐述:数据新闻实质上就是一个工作流程,主要是通过对数据进行反复的分析和重组,然后深度地挖掘数据信息内部的含义,并对数据信息进行筛选,找到合适的信息,最后利用可视化技术将数据合成。

    随着社交媒体、云计算、物联网等技术的发展,海量信息的产生只需极其短暂的时间:一分钟内,微博推特上新发的数据量超过10万;社交网络“脸谱”的浏览量超过600万。一天内,互联网产生的全部内容可以刻满1.68亿张DVD;发出的邮件有2940亿封之多(相当于美国两年的纸质信件数量);发出的社区帖子达200万个(相当于《时代》杂志770年的文字量)。①与传统意义上的数据不同,基于云计算、物联网等技术而产生的大数据记录了人类活动的各种分散信息,包括政府、企业、社会团体等主动公开的数据库,媒体自己建立的数据库,用户数据、社会化平台上的UGC、移动终端的地理信息,物联网及各种传感器捕捉的数据。②

    数据新闻,也称数据驱动新闻,就是通过对大量数据和信息进行分析、处理,运用可视化和叙事化手段表现的新闻。在大数据时代,数据新闻可以实现对信息更明晰的呈现、更准确的分析和更深层的解读,正逐渐成为一种主流的新闻报道方式。

    荷兰数据记者亨克·范艾斯站在数据新闻内容的层面,认为数据新闻使记者能够通过发现、制作、呈现大量数据,展现原本工作流程未曾报道过的新闻故事,发现新的报道角度。②德国之声电视台的米尔科·劳伦兹则明确提出,数据新闻是一种新闻生产流程,包括以下步骤:通过反复抓取、筛选和重组来深度挖掘数据,聚焦专门信息以过滤数据,可视化地呈现数据并合成新闻故事。③

    美国的Narrative Science是一家专门训练计算机编写新闻报道的公司,该公司每隔30秒左右就能撰写出一则新闻报道。公司创始人哈蒙德认为,“未来新闻90%以上将为电脑化新闻”。③ 英国著名综合性日报《卫报》在数字化转型中,积累了利用大数据进行新闻报道的成功案例。2009年,它根据英国下院公布的5500个PDF文档挖掘出英国议员开销的数据报道;2010年,它利用维基解密数据和谷歌地图软件,制作出数据新闻《伊拉克战争日志》,将每一名阵亡士兵作为一个红点标注在地图上的对应阵亡地点,触目惊心的红点地图所揭示的新闻事实引起英国社会震动,并在很大程度上推动了英国做出撤军伊拉克的决定。在国内,财新网是利用媒体和政府公开的数据进行数据新闻报道的领衔者,其数据新闻栏目《数字说》(Data news)主要通过对这些公开的数据进行挖掘、剖析和重整,完成深度报道。

    当前,国内报纸在数据新闻方面也有不少成功的案例,但相较国外媒体,在内容的深度和数据的丰富度上有一定差距。本文结合《卫报》《纽约时报》《华盛顿邮报》等代表性媒体的数据新闻报道,学习借鉴国外报纸的经验与方法。

    国内学者方洁认为,狭义的数据新闻是指一种基于数据抓取、挖掘、统计、分析和可视化呈现的新型新闻报道方式,而广义的数据新闻是新闻学的一个新兴领域,其特征包括:为公众服务、以公开的数据为基础、有特殊的数据技术保障、以形象互动的可视化方式呈现新闻。④

    数据新闻是基于大数据收集、整理、分析,进而挖掘数据背后的关联和意义而形成的一种新的新闻报道。这种基于互联网技术而呈现的巨量数据,将对传统的新闻报道产生巨大影响。业界和学界集中关注了数据新闻及其对传统新闻实践的意义,认为数据新闻是对传统新闻报道的完胜,并乐观地预计数据新闻报道对传统新闻报道的冲击甚至替代。数据新闻报道是否真能取代传统新闻报道,数据新闻是否永远真实和安全,数据新闻是否弱化了新闻专业标准等问题,尚未被学界集中关注。对此,本文从大数据本身出发进行探析,以有助于业界和学界对此问题的全面认 识。

    国外数据新闻偏重严肃选题

    有关数据新闻的生产模型,伯明翰城市大学教授保罗·布拉德肖则在《数据新闻的倒金字塔结构》中提出了“双金字塔模型”模式,包括前期工作(数据汇编、数据整理、了解数据和数据整合)和后期传播(可视化、叙事化、社会化、人性化、个人订制化和使用六个步骤)两部分⑤。财新网黄志敏认为,数据新闻的生产包括:选题、数据处理、文案、设计、程序、数据可视化作品。

    一、数据新闻报道:会取代传统新闻报道?

    国外数据新闻的选题涉及面非常广,没有一定的限制,但更偏重严肃选题,注重挖掘意义。一般情况下,有三个基本原则:一是热度,即关注当前发生的重大事件或热点问题;二是角度,即可从数据的角度进行分析,且有可获取的数据;三是深度,即可以通过大数据进行深层次解读,以数据本身的价值吸引受众。

    在数据新闻的社会内涵方面,英国的独立多媒体记者亚当·韦斯特布鲁克看重其可能给公众带来的利益,他表示:数据新闻使新闻回归本质,即挖掘公众无暇处理的信息,核实信息并理清信息的内涵后将之发布给公众。

    大数据来源广泛,它可提供记者观察不到的、更广泛的信息,这弥补了传统新闻报道在宏观和中观叙事中的不足,也开创了传统新闻报道不可能触及的领域。数据新闻报道的前提是各种数据的公开,没有数据公开就不可能有后续的数据收集、整理和分析。但大数据并非触手可及,亦非遍及新闻报道所涉及的所有领域。虽然近年来世界多国兴起了数据开放的运动,但随着对数据价值认识的不断提升,各行各业对数据的保护也在加强。数据新闻的制作依赖于能够获得的公开数据,如政府或企业主动公开的信息,而信息公开的程度取决于政府或企业,这自然限制了数据新闻报道的需要。当然,媒体除了获得政府或企业主动公开的信息之外,还可通过与社会大数据资源共享、合作的商业模式,实现数据的抓取和获得,进而实施数据新闻报道,但这一模式在国外新闻界刚刚试水,在我国尚未发展。因此,与传统新闻报道相比,数据新闻报道尚不具备如传统新闻报道在频次和内容上的可持续更新能力。更主要的是,数据新闻的发现主要来自具有持续的数据形成机制的行业或领域,目前这些领域主要集中在金融和体育行业以及物联网技术广泛应用的行业。数据新闻也主要集中在这些行业的报道,其并没有涵盖所有的新闻报道领域。

    例如,2010年10月,《卫报》发布了《维基百科伊拉克战争日志:每一次死亡地图》的数据新闻。新闻使用来自维基解密的数据,借用谷歌地图的免费软件Google fushion制作了一幅点图,将伊拉克战争中所有的人员伤亡情况标注于地图之上。地图上的每一个红点便代表一次死伤事件,鼠标点击红点后弹出的窗口则有详细的说明:伤亡人数、时间,造成伤亡的具体原因。学者对其的评价是“新闻从业者富于人性的思索通过精准的数据和适当的技术被传达出来”。这则数据新闻让《卫报》一鸣惊人,一定程度上推动了英国最终做出从伊拉克撤军的决定。

    关于数据新闻传播效果,国内学者彭兰认为,在实际运用中,数据新闻的呈现方式让用户可以研究数据、发现故事、做出评论,或是提出质疑之处,这种和受众分享数据的过程从某种角度上改变了新闻产制的过程,媒体数据团队和用户之间搭建了合作平台,集体协作生产新闻,使众包新闻成为现实。⑥

    因此,数据新闻作为大数据时代新闻报道的一个新形式,它强化了新闻报道的某些领域,弥补了传统新闻报道的弱势,但它不能完全取代传统新闻报道,而是传统新闻报道的补充,共同构成对社会环境的监测。

    数据新闻的核心价值在于对现象背后的本质的深刻揭示,只有加强对严肃选题的重视,才能更大限度发挥数据新闻的社会意义,扩大媒体影响力。

    综上所述,当前,国内外相关专家学者关于数据新闻理论的研究已有不少成果,但尚未形成体系,尤其是鲜有专家学者从中外数据新闻实践对比的角度进行研究,这为本研究提供了空间。

    中外数据新闻实践的相通之处

    作为一种动态新闻报道形式,数据新闻早在2007年就被国外媒体广泛运用,《卫报》《华盛顿邮报》《纽约时报》等大型新闻媒体都开始对其进行探索。2009年起,数据新闻实践在各国蔓延开来。中国数据新闻的兴盛是在2012年以后。国外媒体在突发事件、健康传播、公民生活等领域积累了丰富的经验,而国内媒体较擅长政治、经济事件报道。比如,财新网的“数字说”频道即针对数据新闻开设,以图片的形式在整个栏目的右侧进行展示。所涉及数据信息有房产、股票等,用户可各取所需。2012年,搜狐、网易、新浪等门户网站也开设专栏进行数据新闻报道,部分新闻网站开设了图解栏目。

    本文通过对五届全球数据新闻奖获奖的38个作品、两届中国数据新闻大赛30个获奖作品进行分析后发现,中外数据新闻在叙事、调查、应用等方面存在共性。

    通过图表图画叙述新闻故事

    一篇高质量的数据新闻作品不仅通过数据清晰明了地向受众传达意义,还要赋予美感,让人容易读懂。例如,将大量文字和数据整合成一个或多个简洁的信息图,将故事蕴含其中。

    Detective.io平台对多个开放的数据源进行整合,制作成《移民档案》,揭露了移民在飞往欧洲的路上遭遇的故事,同时也讲述了这些事件对这些国家的移民政策产生的重要影响。中央电视台《晚间新闻》推出的“‘据’说”系列节目,代表作有《“据”说春运》《“据”说春节》《“据”说两会》,运用视频的形式,讲述了一个个可读性高的故事。比如,《“据”说春运》中用“大数据”展现“大迁徙”,使用百度提供的动态迁徙图,表现我国居民在春运期间的迁徙状况。地图上的光度越亮,代表在此处迁徙的人数越多。又如中国传媒大学的作品“互联网和我们”是一则社会新闻,该作品在梳理中国互联网辉煌20年的基础上,讲述了移动互联网对人类社会生活的渗透与影响,并与普通人的生活产生了紧密的联系。

    通过数据分析调查事件真相

    调查性报道往往能在最大程度上展现真实客观的新闻,可以通过对数据进行搜集、整理和分析,发现规律和隐藏在背后的真相,从而击碎谣言。

    国外揭示某一真相或现象的调查类新闻比比皆是。如华盛顿为降低医疗补助成本,引入成本低于一美元的麻醉剂美沙酮,并宣称是安全的。对此,美国《西雅图时报》的报道《美沙酮和痛苦的政治》,用数字讲述了美沙酮消费与死亡的情况。从“国家将药物列入名单以来使用猛增”“美沙酮比其他药物导致更多的死亡”“华盛顿的受害者聚集在较贫穷的地区”“与美沙酮相关的医院护理费用飞涨”“华盛顿是全国最糟糕的州之一”等几个板块,揭示了美沙酮的极大危害。

    我国在调查类数据新闻领域虽发展缓慢,但也出现了一些比较优秀的报道。每日经济网开设《图数馆》栏目,以“图破新闻,数说真相”为宗旨。财新网制作《影视剧大数据造假,流量太高全国网民都不够用了!》,通过数据和图表指出了我国几乎所有的热播剧点击量均注水的现状,一份检测显示明星人气也靠刷,揭露了水军刷数据产业链等。批判了数据造假造成我国影视行业劣币驱逐良币的乱象。另外,中国第二届数据新闻大赛一等奖作品《大数据解读国民阅读中的“一带一路”》,今日头条利用独有的后台检测技术,揭露了“一带一路”有多热,谁在关注等问题。

    通过数据挖掘发现隐含逻辑

    数据新闻的最终目标是为受众带来有价值的报道,即受众想要了解而无法获得、能揭示某些联系和变化的内容。要达到这一目的,需要记者编辑在大量的数据中发现隐含的逻辑,并进行整合,形成一条有主线的新闻报道,进而引起受众的关注和兴趣。

    如BBC的《英国阶级计算器》从职业、财富和教育等方面对16.1万人进行调查,结果显示,在英国存在7个社会阶层。这引起了英国社会的广泛关注。此外,法国WeDoData网站发表的《Le Pariteur》,因揭示了法国公司男女员工工资差异而受到热议。

    在国内,财新网发表《民间借贷纠纷案 江浙粤鲁四个省占了40%》一文,通过对中国裁判文书网的数据进行分析,发现近三年因高利贷发生的纠纷年均都在万件上下。2017年第一季度尚未结束,其案件数就已超过2009年全年的案件数,高利贷案件多发区集中在东部沿海,包括江苏、山东、浙江、广东一带。这一作品在一定程度上将舆论引到探讨民间资本借贷问题上。

    本文由澳门新葡亰平台官网发布于中国史,转载请注明出处:中外数据新闻实践现状与比较研究,大数据时代

    关键词: