《新闻战线》概况
日 报周 报杂 志 人民网

数据可视化:数据新闻在健康报道中的应用

● 李希光 赵 璞 《 新闻战线 》(

    数据可视化(Data Visualization)作为概念被提出,肇始于上世纪80年代, 是指利用计算机图形学和图像处理技术,将数据转换成图形或图像显示出来,并进行交互处理的理论、方法和技术。它涉及计算机图形学、图像处理、计算机视觉、计算机辅助设计等多个领域。

    近年来,社交媒体不仅改变了媒体话语权力结构,也改变着新闻业内容生产的形态,基于数据挖掘的可视化新闻报道开始涌现,以英国《卫报》和美国《纽约时报》等为代表的传统媒体开始利用网站、社交媒体平台推出可视化的数据新闻报道,利用数据流海量、准确、全面的信息优势和视觉传播产品传达清晰、互动性强的特点,对复杂问题、系统性问题进行报道。例如伦敦马拉松爆炸案、“桑迪”飓风事件等。作为数据新闻的先行者,《卫报》于2009年开设数据商店板块,不仅通过数据博客呈现可视化新闻作品,而且向用户开放数据库的链接和搜索。①传统通讯社路透社也在2013年开设Data Dive频道,在财经报道中引入可视化新闻作品。

    数据可视化与数据新闻

    为何要谈论数据?数据本身对新闻工作来说并不陌生,早在1821年,《卫报》上已经出现了数据表。随着大数据时代的来临,多样化的数据来源、巨大的数据量和快速处理数据工具的出现,让海量数据分析成为可能,有助于媒体突破传统的媒介报道形态。欧洲新闻学中心(European Journalism Centre)和开放知识基金会(Open Knowledge Foundation)联合一批研究数据和新闻的专家发表了《数据新闻学手册》,指导记者参与这场新闻变革实践。米尔科?劳伦兹就提出,随着受众获取信息的渠道越发多样,新闻记者不能满足于报道“发生了什么”,而是应该通过数据整合,将工作重心从抢占事件的第一落点,转变为提供优质、全面、深刻的数据分析。② 

    在亚利桑那大学教授Steve Doig看来,“数据新闻学就是获取信息的另外一种方式,数据新闻实质上是受众对数据所做的一次采访。”③如果说媒体记者是通过和被采访人的交流获取信息,那么数据新闻则是将寻找数据背后的隐含信息的权力赋予了公众。但是单纯的数据展现方式会枯燥乏味,容易造成理解上的困难和偏差。因此,利用数据可视化工具制作新闻作品,已经成为一些媒体尤其是网络媒体报道的重要抓手,也已成为数据新闻学的重要组成部分。数据的可视化通过反复抓取、筛选和重组来深度挖掘数据, 聚焦专门信息以过滤数据, 可视化地呈现数据并合成新闻故事。

    由谷歌公司资助创立的首届数据新闻奖将大数据新闻项目的创新分为三个类别,分别是“数据驱动的调查性报道”、“数据可视化和数据叙事”、“数据驱动的应用”。④ 可见,对数据可视化的理解,已经超越了视觉信息辅助文字报道的旧有概念,视觉化作业已经可以作为独立的新闻作品。

    数据可视化对于新闻报道的价值,体现在知识和信息传播的需要。借助数据可视化工具能够将抽象概念简单化,特别是可以通过海量数据的加工、整合将通过文字、图像难以描述的现象进行全景式的展现。纵观近年来国内外媒体在数据可视化领域的实践,集中体现在三方面:一是交互性。实现图像的动态演绎,提升用户在获取信息过程中的主动性,通过在线的数据搜集反映社会现象。例如《卫报》编辑通过邀请学生读者参与调查,请他们判断自己所在大学与英国其他院校的教学水平差异:结果发现读者对大学教学水平的判断与权威大学排名出入较大;读者可以实时选择观看来自自己所在大学同学的投票情况。二是多维性。这类数据可视化一方面体现为多元信息与地理信息的叠加,另一方面不依赖传递事实,而且注重传递经验、态度、观点、意见等主观性变量。《纽约时报》对马航客机MH370失联事件进行报道时,模拟飞机从起飞到失去联系的数个小时中所处的不同飞行高度、飞行时间、飞机上可能出现的各种意外状况等多个变量,并通过图表进行了展现。⑤三是数据间的关联性。新闻报道中,每个消息内部都有一个简单的数据关联,并且包括两种数字,表示数量的数字和表示分类的数字。⑥出色的数据可视化作品往往是通过一整套数据结构和逻辑展现数据间的关系,通过数据关联和比较,阐发报道的核心主题。

    数据可视化在健康报道中的实践

    本文所指健康报道特指媒体网站的“健康”一栏中的报道以及电视媒体中对有关公众健康的报道。笔者以埃博拉感染事件为例,分析和比较对于这一在全球引起恐慌的公共卫生事件,媒体是如何利用数据可视化建构报道的。

    埃博拉病毒(Ebola virus)又译作伊波拉病毒,是一种能引起人类和灵长类动物产生埃博拉出血热的烈性传染病,致死率很高。埃博拉病毒最初于1976年出现在当时名为扎伊尔(现刚果民主共和国)和苏丹(现南苏丹境内)两个国家,共导致431人丧命。在扎伊尔,当初有88%的感染病例死亡。今年的埃博拉病毒疫情2月爆发于西非,根据世界卫生组织的数据,截至10月8日,共有7个国家的8399人感染埃博拉病毒,其中死亡人数达4033人,堪称该病毒上世纪70年代被发现以来爆发最激烈的一次。尤其是一名美国医生在非洲感染该种病毒被曝光后,一时间引起了美国国内的巨大恐慌,甚至有民众在社交媒体上发帖,要求不要将埃博拉病毒感染者接回美国。⑦本文选取了从2014年6月初埃博拉病毒开始被国际媒体广泛关注,到2014年8月美国公民感染上埃博拉病毒被送回国这段时间作为分析对象,从客体分析、影响范围、症状预警这三个公共卫生事件中需要及时向公众传递的信息出发,分析境外媒体数据可视化报道中,在选取数据、展现数据和分析数据等方面的异同。

    客体分析:埃博拉病毒的历史

    对健康议题的报道,是媒体将现象和研究成果转化为大众的健康知识,从而改变公众健康理念和行为的过程。《纽约时报》采用时间链条的方式,对埃博拉自1976年以来诸次爆发的情况进行了汇总,用两个圆圈组成的同心圆分别表示当年爆发发现的病例数和死亡人数,特别是将每年爆发的情况与爆发地一一对应,向读者准确传达了包括20世纪以来埃博拉的爆发愈发密集、病毒致死率高、波及范围仅限于西非洲等信息。

    英国广播公司的网站同样采用了时间链条作为横轴,采集标准采用每两年为一个单位,在展现方式上采用了柱状图的结构,纵轴变量同样选取了当年发现病例数与死亡人数,与《纽约时报》相比没有强调爆发地点。从上文所提到的可视化数据的三个维度看,《纽约时报》的作品展现维度更多样,更强调数据之间的关联性。

    路透社的报道相比较于前两者,在时间轴中引入了国别的变量,与前两篇报道侧重于介绍在西非蔓延的情况不同,路透社强调这场疾病对整个撒哈拉以南非洲的实际影响,尤其是将中南部非洲受影响国家在地图中特别标注出来,传达出对疾病可能对周边国家产生影响的忧虑。《电讯报》对信息的覆盖最为全面,对埃博拉在过去几次爆发时的病毒束进行了区别,在本文所列举的四家媒体的可视化报道中,空间维度和时间维度的结合可谓最为紧密。

    影响范围:埃博拉病毒的影响区域

    《卫报》针对病毒的扩散,利用地图标注了西非地区现存的埃博拉病毒实验室的数量和所处位置,以及有条件治疗埃博拉病毒的诊疗中心。但是编辑并没有标注出相应的比例尺以及圆圈大小所代表的具体含义,整体内容传达信息模糊,数据的指向并不明显,更接近于信息图(Infographic)。

    《赫芬顿邮报》在同一日的数据报道中则覆盖了《卫报》报道中相对缺失的信息,特别用有差别的颜色区域对不同国家的受传染情况在同一张图上进行了标注,数据的关联性较《卫报》同类报道更强。

    症状预警:埃博拉的症状和传播途径

    媒体是公众获取健康信息的主要渠道,而大众媒体对健康风险问题的报道会很大程度上影响公众对风险严重性的判断,公众习惯于通过从大众媒介获得的健康信息来帮助做出决定。⑧大型传染性疾病的流行,个体会加重对健康风险的判断,大众媒体便成为普通公众了解疾病预防和控制相关信息的最重要渠道。

    香港最大的英文报纸《南华早报》在综合了美国疾控中心和加州大学的数据后,重点对疾病的症状和可能对人体器官产生的危害进行了细致解读。将症状的初期和症状加深后的征兆进行了严格区分。此外,作为香港本地媒体,它还将埃博拉与曾经在当地肆虐的SARS病毒在致死率、当前是否有成熟的治疗措施等方面进行了对比。

    数据可视化对健康新闻的意义与启示

    密苏里新闻学院在一项针对全美健康新闻报道者的调查报告中指出,健康新闻专业性的提升,长期受制于从事该类报道的新闻记者大多缺乏严格的公共健康领域的专业训练。这一方面体现在传递关键性信息时,由于报道者担心对专有名词阐释不清,因此选择性规避那些难于理解的部分;另一方面,大多数记者对于公众的健康素养的认知程度不准确,容易导致报道专有名词堆砌,或者是一味追求浅显,遗漏关键内容,从而衍生为谣言。因此,对关键信息的翻译,尤其是将大众并不熟悉的专业性知识,转化为可供大众理解的信息,是影响健康新闻实现有效信息交流的关键。而左右“信息理解”这层横亘在专业数据提供者和公众之间的关键性因素便是数据。

    数据可视化有助于提升专业新闻的“阐释”效果,《信息之美》一书的作者、《卫报》和《连线》杂志记者麦坎德利斯曾说,新闻与可视化的关系本身就很密切,两者同样致力于“信息优化”的目的。⑨新闻作品经过对文本结构的设计和文本修辞的选择,筛选、凝练信息,帮助读者形成清晰的概念;同样,设计也是将大的话题分解为设计的元素和设计元件,就如同在新闻作品中寻找最佳的逻辑线索和最合适的表达方式。

    在健康报道中推进可视化工作,需要合理利用“公开数据”。尤其在公共卫生领域,信息交流的过程中,数据扮演着相互理解的关键角色。公共卫生的监测数据经过多年的沉淀和发展,已经扩展到社会的各个领域。根据肖辉等人的研究,公共卫生领域的数据来源包括现场调查数据、社会经济类数据、疾病相关数据、自然环境数据以及实验室检测数据。不仅人的生活和行为当中蕴含着大量的数据信息,包括专业性社会组织如疾控中心、公卫科学数据中心等都面向媒体、公众提供大量可供查询的权威数据。对健康信息尤其是专业信息的阐释,数据和图像比文字描述具有显著的优势。

    作为新闻业中颇为资深的数据可视化实践者,麦坎德利斯认为用数据讲故事的关键在于背后的调查研究,在他看来,在数据可视化工作中只有20%左右的工作是与设计有关。数据可视化的优势在于能够在单个作品中有效融合多维度信息,通过可视化工具展示事件的数据结构,因此需要通过足够的调查研究,实现新闻“数据分析”的价值,提高数据之间的关联性。例如,《卫报》在2013年所做的有关“禽流感”的可视化报道中,为了准确阐明H5N1病毒的衍生和来源,对20多种相关病毒的危害性、是否传染人等信息进行了全面的解读。

    (作者李希光系清华大学国际传播研究中心主任、教授、博士生导师;赵璞系清华大学新闻与传播学院博士研究生,清华大学国际传播研究中心研究助理)

    责任编辑:武艳珍

    注释:

    ①方洁、颜冬:《全球视野下的“数据新闻”:理念与实践》,《国际新闻界》2013年第6期。

    ②参见http://datajournalismhandbook.org/1.0/en/introduction_1.html。

    ③参见http://journalistsresource.org/skills/research/understanding-data-journalism-overview-tools-topics#。

    ④喻国明、王斌、李彪、 杨雅:《传播学研究:大数据时代的新范式》,《新闻记者》2013年第6期。

    ⑤The Search for Malaysia Airlines Flight 370,Newyork Times, 2014-03-14。

    ⑥王凯、贺丽:《信息可视化设计》,辽宁科学技术出版社2013年版,第15页。

    ⑦《美专机接两名埃博拉患者回国》,《钱江晚报》2014年8月3日。

    ⑧任杰:《健康传播在疫病防治中的重要性研究》,中国科学技术大学2012年博士学位论文。

    ⑨龙心如、周姜杉:《信息可视化的艺术——信息可视化在英国》,机械工业出版社2014年版,第63~67页。

数据可视化:数据新闻在健康报道中的应用
从马航失联报道看主流媒体微博传播
网络新闻的法律保护:欧洲的发展