自2011年起,西方有关“大数据”的理论像旋风一样席卷知识界,这方面的学术讨论接连不断。我国新闻界也开始了探讨,西方的“数据驱动新闻”、“数据决定话语自由”的说法,在国内流行起来。
“大数据”是个什么概念
“大数据”同信息是不可分离的,是指信息浩大数量的统计与技术运作。作为人类认知社会方法的一次飞跃,“大数据”技术将给企业运营、政府管理和媒体传播的科学化创造有效机制。
“大数据”这一语汇的深刻意义,在于如何对巨量信息迅速做出有价值的处理和加工,使人类在信息爆炸面前成为主宰。各新闻媒体建立“大数据”机构,综合不断涌现的信息,提前预知并及时掌控突发事件,能够探索社会发展趋势。
新闻界创造“大数据”分析平台,要求编辑记者处理信息的速度要快,以适度的信息形式把新闻传播出去。无穷无尽的社会信息把是非关系、真伪现象、各种利益交错和非结构化的思想流和行为流交织在一起,事件的缘起和真相往往隐匿于浩瀚的数据之中。缺乏充分的数据,仅凭一两个事实和语言表白,很难发现潜在的新闻,捕捉到事物真相。许多媒体人都有体验,在海量信息中选择一条有较高价值的新闻十分不容易,目前只能凭借媒体人的新闻价值观做出判断,难以避免主观误判。
“大数据”的两面性
从积极方面说,大数据确实已成为数据王国的主线,是下一步信息研究的主要对象。大众传媒、社交媒体和经济社会各个领域如何使用大数据,正确评估大数据的商业价值,建立大数据的新兴产业,培育大数据的专业人员,将极大推动社会变革和经济发展。哈佛大学社会学教授加里·金说:“这是一场革命,庞大的数据资源使得各个领域开始了量化进程,无论学术界、商界还是政府,所有领域都将开始这种进程。”①
从消极方面看,大数据技术不是万能的,不能解决一切问题,它只是决策的一种量化手段。正确认识事物的是非和利害,遵循人文精神——公良义善、尊重人与各民族的正当权利是更为重要的前提。缺少这个前提,大数据不仅毫无用处,而且能为谬论寻求数据支持。
新闻传媒反映主流舆论,做出正确而精准的报道,仅仅依赖数据还远远不够。互联网、大众传媒和社交媒体每天提供的巨量信息有大量冗余、虚假和有害的内容,其中侵犯他人隐私权、生存权和精神健康权的信息与图像大肆泛滥,价值密度较低。人类不但不能把大数据一股脑地当做宝库,而且要冷静审视数据的两面性,抛弃有害和无用的信息,使数据分析立于价值和法律层面,避免浪费专业人员的时间和精力。
正如迈尔·舍恩伯格在《删除:数字时代遗忘的美德》一书中所说,数字技术和全球网络压倒一切,使我们忘记自己的自然能力,我们必须重新恢复记忆。人类应采取的措施是“数字化节制、保护信息隐私权、建设数字隐私权基础设施、调整人类的现有认知、打造良性的信息生态、完全语境化”。“大数据的取舍之道,就是把有意义的留下来,把无意义的去掉。只有理解了在大数据中,需要的是什么,以及如何判断这种需要,才能举一反三地明白到底为什么要去掉那些不需要的。”②
媒体驾驭“大数据”的认知原则
媒体驾驭大数据是发现新闻的重要途径。今后的新闻素材主要来自互联网、物联网和社交媒体,新闻信息虽然源源不断,但良莠交错,云计算的“提纯”是选择新闻事实的主要手段。每天处理当日“信息嫩芽”(刚刚出土的新数据),使新闻素材保持最大的新鲜度,加重了媒体工作的紧张程度,稍有怠慢,更多的海量信息积压起来,媒体就可能陷入数据深渊而窒息。
新闻数据不断产生,分散、蔓延、杂乱,媒体处理数据的鉴别力、精准率是加工信息的主要效能。“提纯”是认知客观世界的目标,提取新闻信息既要全面又要实时,经过一次次“提纯”和“净化”,才能达到新闻事实的精准度。大数据中的新闻素材不是核心资源,仅仅是新闻“毛坯”,或称“二手资源”。对于本地区新闻,记者的大量实地采访,获取第一手事实仍不可缺少。大型媒体仍需向异国、异地派出驻站记者,亲自获取新闻具有主创意义。
在大数据统计中,数据频现的事件蕴藏着新闻价值,可从中发现大新闻。一个事件、一种现象是不是新闻,值不值得报道,不仅仅根据数据,更重要的是依据新闻价值理论做出判断。新闻价值理论是报道规律的总结,大数据排查不仅不能代替它,而且受其指导才能做出正确的认定。新闻事实的重要、新鲜、有趣或接近性能够派生出新闻价值,但不是新闻价值本身。新闻价值要素是指对受众有用、有益、有效,包括对受众生活的指导性、对提高受众思想道德的激励性和对陶冶受众性情的娱乐性和快慰感。这三种新闻价值成为新闻数据分析的“引擎”,而不是简单地以数据的多少确定新闻价值。
记者陈述鲜为人知的事件并寻找新的角度,需要完整的故事,大数据能够再现这种故事,并提供个性化的细节。数据库可以提供可视化的形式,帮助任何形式的新闻写作,并为其创建清晰的描述。这些数据既可用来说明事件的结果,也可发现记者先前判断的疏漏或误导。一个故事是否可验证,要通过数据源、数据集、数据质量和数据格式的检查,发现可能包含的虚假成分,但哪个具体事实与细节是假的却难以肯定。大数据不能解决新闻真实性问题,只有实地核查,才能真实地报道新闻。期盼数据提供完全的真实,有太大的风险。
新闻媒体不仅要对大数据提供的思想做出真理判断,还需要独立思考,遵循新闻真理性原则写出独家评论。大数据中也有各种判断和结论,是否都能提供“思想”、特别是正确的思想,无疑是否定的。德国学者赫尔曼·麦恩曾说:“尊重真理,对公众做真实的报道,是新闻界的最高准则。”③新闻的真理性是以真实、客观为前提的,但不是真实、客观本身,它是在科学实践中被验证的,厮守人类正义和社会真相,反复权衡怎样报道才能对人类无害。对此,法国著名记者杰克·凯塞尔强调:“真理问题是相当简单的,一个新闻记者必须说真话;歪曲事实或背叛真理的记者是不配做这一职业的。但是,对于真理闭口不言的人,是否应受到谴责呢?为了回答这些问题,我们不仅要求消息准确,我们还要看消息是否适宜登载。”④因此,大数据只能是发现真理的途径,坚持这一途径的媒体正确价值观才是首要的。
(作者系清华大学新闻与传播学院教授、博导)
责任编辑:武艳珍
①常政:《爆发:大数据时代的人类行为模式》,中华读书报2013年1月16日。
②Viktor Mayer-Schonberger, Delete: The Virtue of Forgetting in the Digital Age,Princeton University Press,2011,p.198。
③ [德]赫尔曼·麦恩:《联邦德国大众传播媒介》,联邦德国驻华使馆(Colloquium im Wissenschaftsverlag Volker Spiess GmbH,1994),第37页。
④[法]杰克·凯塞尔:《一种自由的死亡——新闻的技术与政治》,Alain Beaulet(阿兰必乌利特出版公司) 1955年版,第5页。




放大
缩小
全文复制



