摘要:大数据、人工智能、虚拟增强现实VR/AR等新兴技术发展,驱动新闻流程再造与模式升级。DGC和PUGC的拓展和渗透应用,使得数据的多源化、精准化、可视化、叙事化逐步提升,新闻的自动化、深度化、交互化、个性化不断升级。国内外业界对数据新闻的探索也不断取得创新突破,行业先驱涌现,大数据之于新闻的应用空间在加速扩张。
关键词:大数据 数据新闻 流程再造 未来媒体
从对新闻内容客观性和准确性的检验支撑,到对新闻热度和价值的量化评价,再到对新闻制作和呈现形式的颠覆升级,大数据之于新闻媒体的应用价值和空间在不断拓展。随着人工智能、虚拟现实、可穿戴设备等新兴技术的崛起,数据新闻在信息源、自动化生产、多维呈现等方面都会实现跨越式升级,数据新闻制作的全流程也将在技术驱动下革新与再造。
数据的全流程渗透
大数据给新闻行业带来了巨大的想象空间,数据可以不同形式根植在新闻制作的各环节中,逐步实现对新闻流程全方位、多角度、深层次的渗透。数据规模的急速扩张为数据新闻的模式创新和流程再造提供了底层基础,设备生成内容DGC(Device Generated Content)和专业化的用户生成内容PUGC(Professional User Generated Content)作为一种驱动因子和引导因子,其新闻价值也不断被激活,在技术驱动下逐渐渗透到数据新闻制作的各个环节,推动数据新闻从数据化、可视化向交互化、个性化升级。本文将UGC、DGC和PGC三种主要数据源归纳为表1所示。
其中,以三微多端(微博、微信、微视频、客户端)为主的新媒体传播场域逐渐成为UGC的主要来源地,传播形态和交互模式的创新也让UGC呈现出更多维度和更深层次;移动终端、可穿戴设备、无人机等技术产品的普及让DGC的来源加速扩张,万物皆媒介时代DGC的触角无处不在,也助推着数据新闻的场景化、个性化发展;通过大数据和人工智能技术对PGC进行规律挖掘,将进一步驱动新闻自动化,从财经、体育等行业领域开始向更多领域普及,PGC也将逐步向PUGC和DGC转化。
数据源的扩张为生产流程的再造提供了生产要素与技术基础。本文将数据新闻的制作流程划分为从选题策划、数据采集到新闻作品输出、读编交互等在内的七个环节,从技术应用、数据价值挖掘、模式创新等方面总结出数据新闻的制作流程,如图1所示。
国外数据新闻行业先驱
国外在数据新闻领域的实践相对较早,其中传统新闻媒体更是成为行业应用先驱。如英国《卫报》《泰晤士报》,美国《纽约时报》《华盛顿邮报》《洛杉矶时报》等多家媒体机构均开展了相关业务,构建了专业的数据新闻制作团队和强大的数据支持系统。相比之下,国内的数据新闻发展相对滞后,虽然部分媒体有所涉足,但形成常规性、专业性、多态化报道的媒体并不多。本文选取部分媒体为代表,对国外数据新闻制作的典型模式进行总结。
《纽约时报》“The Upshot”
“The Upshot”是《纽约时报》于2014年4月推出的新栏目,主打数据新闻。“The Upshot”针对政治经济领域,旨在通过数据分析和呈现,帮助读者洞悉复杂政经事件背后的含义。除了严肃的政经主题之外,还推出了许多体育主题的作品,覆盖世界杯、橄榄球、棒球、足球、NBA等等。“The Upshot”每周约发布21篇数据新闻,发布富有创造力、互动性强的数据可视化作品,设计兼具个性化与功能性,既可以满足个体读者与数据新闻报道或产品互动的需求,又方便读者和用户上手操作。此外,《纽约时报》推出机器新闻产品Blossom和新闻VR应用程序NYT VR,不断探索技术创新应用模式。①
《华盛顿邮报》地图新闻
从2013年5月起,《华盛顿邮报》先后报道了十几个地图式新闻,还有几十个其他的图式新闻,几乎都是以数据方式呈现,均与现实新闻热点紧密相关,既包括棱镜事件、堕胎合法化、移民政策等议题性主题,也包括奥巴马出访、独立日庆祝等事件性主题,还有高跟鞋的害处等服务性主题。《华盛顿邮报》以地图新闻为特色,用数据挖掘的手段获取各种结构化的信息,并以数据化地图的形式,呈现数据新闻。华盛顿邮报建立数据库,从数据和采访找故事,以故事理顺逻辑、说明数据,又以数据佐证故事,阐释问题的规模和影响。报道用典型案例切入,再用数据呈现问题全貌,重视互动。此外,还运用AR(增强现实)和pop-up(弹出的推荐窗口)等技术,增强可视化新闻的交互式用户体验。
《卫报》数据博客
英国《卫报》(The Guardian)以数据博客(data blog)定期发布数据新闻,共制作各种类型数据新闻2500多则。涵盖政治、经济、体育、战争、灾难、环境、文化、时尚、科技、健康等细分领域,包含图表、地图以及各种互动效果图,数据类型既有量化数据也有质性数据,另有两者兼顾的混合数据。《卫报》在早期大量使用Flash作为主要的技术支持手段来实现动态效果,而后运用如Google fushion等免费软件来制图,包括时间线、交互性图表等。《卫报》数据新闻的一个鲜明特色在于,它将制作新闻所使用的数据完全公开。近年来,《卫报》也开始进行VR沉浸式新闻探索,不断提升新闻的交互性。
除了数据化呈现,国外新闻在拓展数据源的基础上实现新闻形式创新。《华尔街日报》整合用户GPS定位创作了“看图猜城市”的可视化互动新闻;纽约公共广播电台邀请听众用温度传感器共同制作了“蝉鸣”实验报道;《休士顿记事报》通过传感器探测报道化工厂土壤污染情况;麻省理工学院媒体实验室开发“穿着读”的“感官小说”体验角色情感变化……②新闻数据源的无限延伸颠覆了传统的媒体呈现形式,同时也开启了全民参与的众包新闻制作模式,使得人与媒介开始无限贴近。
整体而言,国外数据新闻制作主要有以下几种模式。首先,数据驱动的调查性报道,即将叙事性新闻报道和数据支撑相结合,通过对海量数据的整理和反复分析挖掘规律;其次,数据的可视化和交互化,在追求新闻作品本身视觉冲击力的同时准确传达信息内容,实现美感、实用、新闻价值的统一;再次是数据驱动的新闻应用,通过让受众关注数据新闻中与自身具有联系的数据,更深层次挖掘新闻价值,帮助用户和记者衍生出更多新闻数据,提升数据新闻的个性化和服务性,诸如《洛杉矶时报》的“绘图洛杉矶”(Mapping L.A.)便以众包形式描绘洛杉矶街区的犯罪地图,并使用相关数据衍生出多主题新闻。③
当然,不同国家和地区在生产流程、制作理念、分工合作等方面也存在一定差异。例如,以美国《纽约时报》为代表的新闻媒体更加注重数据新闻团队的打造和新闻意识的培养,无论设计师、程序员还是数据科学家,都把自己当作记者在工作;而德国、瑞士等国的数据新闻制作更加依赖分工合作弥补专业差异。④
国内数据新闻创新探索
相比于国外主流媒体在数据新闻制作上的主导作用,国内互联网门户在数据新闻实践上起到了示范作用。网易《数读》、腾讯《数据控》、新浪《图解天下》、搜狐《数字之道》等栏目都在数据新闻制作和呈现上进行了创新性尝试;近年来传统媒体也开始涉足数据新闻制作,如南方都市报的《数读》、新京报的“新图纸”、京华时报的《京华图解》、华商报的《数之道》、中国日报的《FEEDING CHINA》、钱江晚报《图视绘》等板块都以可视化图表、交互式网页专栏等方式不断创新数据新闻模式,制作内容也涵盖时事、体育、经济、娱乐、健康、家居等各个领域,可见数据新闻已成为各大新闻媒体业务发展的一个新趋势。
网易《数读》:用数据说话
网易《数读》栏目开设于2012年1月,是国内数据新闻领域较早的践行者,其内容以数据博客(data blog)展现,旨在“用数据说话,提供轻量化的阅读体验”。 《数读》大约每两到三天发布一条数据新闻,以文辅图,图表兼顾了视觉形式和信息量,既包括常规统计图、数据地图、标签云、时间轴线、流程图、抽象画形态组合等静态信息图,也有少数交互式信息图表。《数读》的色调简单、风格清新、板块明晰,整体给人一种低调优雅的感觉,以多样化的数据新闻带给了读者“悦”读体验。
腾讯《数据控》:用数据解读新闻
腾讯《数据控》栏目开设于2012年12月,成立一年以来已策划了45期数据新闻,内容涉及经济、政治、社会生活等多方面。与其他媒体不同,《数据控》的数据新闻仅以信息图表展示,并不另配文本说明(图表中必要标示除外)。《数据控》的图表形式多样,静态与交互式并存,注重对抽象图形的融合,并通过交互式图表设计为用户个体实现了趋势预测。就设计风格而言,《数据控》色彩鲜艳活泼,元素丰富,形式多变,整体给人感觉相对厚重。《数据控》将图表所包含的信息量进行了放大,推动了新闻媒体走进“读图时代”。
南方都市报《数读》:透过数据读懂城市
南方都市报是纸媒开设专版尝试数据新闻的先例,其开设于2012年5月的《数读》,用多元化的图表对社会新闻和民生信息进行了可视化传达。南方都市报的《数读》从一周两个版扩张到一周八个版,如今已见报百余期,体现了其对数据新闻的日益重视。《数读》以图为主,兼配少量文本说明,信息图表形式多样、设计感强,融入手绘、3D、实物图等多种元素,包含棋盘式、圈层式、分解式、对比式等多种结构。南方都市报用数据实现了新闻升值,在数据中“深挖城市生态,助力纸媒”。⑤
新京报 《新图纸》:让数据穿上感性外衣
新京报于2012年下半年推出《新图纸》版面,内容涉及时事、体育、经济、娱乐、健康、家居等多方面,如今已发展成品牌栏目。《新图纸》对数据进行了反复提炼和高度概括,以图表形式将信息化繁为简,以文辅图,注重图文的结构搭配。在设计风格上,《新图纸》力求简约、突出中心点,色彩清新明快,结构明晰顺畅,带给人舒适而愉悦的视觉体验。除了在纸媒上进行数据新闻尝试,新京报在新媒体平台上也推出了“图个明白”长微博、微信制图等板块,全方位放大了数据的新闻价值。
除了新闻呈现形式和交互模式的数据化、可视化,新闻制作流程也在数据驱动下趋向自动化和智能化。从2012年《华盛顿邮报》“truth teller”生成第一篇机器新闻,到2015年9月国内首次出现机器新闻,新闻传播领域的自动化革命已经开始。腾讯新闻根据算法第一时间自动生成财经类新闻稿件,瞬时输出分析和研判,一分钟内将重要资讯和解读送达用户,基于大数据智能分析实现了新闻的自动生成和推送;新华社的“快笔小新”利用大数据归纳能力和人工智能模仿能力快速生成体育类和财经类新闻,通过探索大数据在信息生成领域的应用途径,推进新闻业务与信息技术深度融合,更好地履行国家通讯社职能的有益探索。⑥据统计,机器新闻年产量已突破10亿篇,机器人写手的补充性存在将极大地解放媒体人的劳动力,数据对新闻生产制作的驱动作用也将到全面升级。
清博“指数”:大数据生态系统的智能服务者
清博大数据是中国最大的第三方新媒体数据搜索引擎,国内最大的“两微一端”新媒体数据平台。
2016年两会期间,清博大数据与央视合作两会专题数据新闻,基于大数据传播与分析两会热议话题的数据新闻产品在央视CCTV4《中国新闻》“我有问题问总理”和“2016中国新视线”中播出。第1期重点围绕2015年的“双十一”话题,从“梯级火线增长、热买横跨世界、全球热议度高、消费积极性高、狂欢五大热词、模式生态创新、电商打通外交”等几大方面运用数据化呈现方式进行阐述。清博指数基于大数据挖掘与分析处理结果,以可视化方式呈现,突出了“双十一”的全球引领效应,形象化地表现 “双十一”给中国人民生活以及世界带来的巨大变化!
用大数据处理方式,形成严谨科学的数据挖掘方案,并形成可视化图表。用专业的议题设置,权威的数据解读,反映中国百姓期待。通过自动识别、聚类等技术进行智能分析、自动排重、分类、摘要、聚合,结果可视化呈现,清博大数据旨在做大数据生态系统中的智能服务者。
数据驱动新闻的未来
从内容生产、交互呈现到关系匹配、用户挖掘,再到服务创新和连接转化,数据之于新闻生产制作的价值不断被放大,对传媒产业链的渗透与革新再造也在不断升级。数据应用在时效性、开放性、深度与设计等方面取得突破进展,助力新闻媒体从DDC(数据驱动内容)到DDS(数据驱动服务)转型。
之于新闻内容生产,无人机、可穿戴设备、智能硬件的普及会进一步拓展新闻信源,实现场景数据的随时随地记录与挖掘;人工智能和大数据技术的成熟将助力机器新闻向更多领域普及应用,促进新闻制作的自动化、智能化、定制化和一体化,数据新闻生产效率和质量将实现突破性升级;微视频、直播、VR和AR等技术的成熟发展,将创新新闻内容的呈现形式和交互模式,使得新闻媒体多维时空的呈现能力、人性化交互能力、引导性构想能力都得到了极大的提升,彻底颠覆了受众和信息的交互关系。
之于新闻推送发布,通过对受众/用户数据的全面挖掘和算法优化,进行需求匹配和个性化推荐,可以进一步提升新闻内容推送的定向性和精准性;同时智能硬件的普及丰富了用户所处场景数据,根据LBS匹配用户周边的新闻资讯、偏好信息,根据天气、环境等数据推送实用信息,数据驱动下新闻媒体的个性化特征凸显。
之于媒体服务拓展,智能互联网时代数据源进一步扩大,用户个体数据经过采集、整合、重组,形成个性化信息图谱,基于个体需求和特定场景的数据驱动服务不断创新;基于场景数据为用户与用户、用户与信息之间建立连接,亦可促进数据新闻的裂变式群化传播,加速数据价值的转化;此外,数据分析方法更加成熟多元,媒体人的角色从内容生产者向数据科学家、预言家进化,助力新闻价值挖掘与拓展。
(作者单位:清博数据)
责任编辑:杨芳秀
注释:
①马金馨:《从〈纽约时报〉、彭博社看数据新闻的运用及发展》,《中国记者》2015年第1期。
②田丰、郑宇:《未来媒体与互联网创新十大展望》,《看传媒》,
http://b2b.toocle.com/detail--6288313.html,2015年9月2日。
③胡兵、王思逸:《国外新闻编辑室及数据新闻运作探析》,《南方电视学刊》2015年第2期。
④Wibke Weber & Hannes Rall. Data Visualization
in Online Journalism and Its Implications for the
Production Process[J]. 16th International Conference
on Information Visualization, 2012。
⑤邹莹:《南都一期“数读”作品的诞生》,http://www.nfmedia.com/cmzj/cmyj/jdzt/201311/t20131120_362395.htm。
⑥新华网数据新闻部:《新华社机器人记者“快笔小新”来啦!》, http://news.xinhuanet.com/video/sjxw/2015-11/06/c_128402154.htm,2015-11-06。




放大
缩小
全文复制
上一篇



