《新闻战线》概况
日 报周 报杂 志 人民网

智能化媒体与未来

● 沈 浩 元 方 《 新闻战线 》(

    人工智能和大数据正在改变媒体。近几年,在内容生产、分发和管理三个方面涌现出了许多人工智能媒体应用;媒体呈现的内容和最主要的媒介——视频、图像、声音、文字都能成为数据,并可借助深度学习技术实现更加智能化的建模。智能化已经是媒体未来的趋势和发展方向。

    当下,“大数据”“云计算” “机器学习”“深度学习”“人工智能”等新概念层出不穷。我们所处的世界被这样的风潮所挟裹,每个行业都不能例外。这些概念所代表的技术,逐渐进入媒体行业,同时又改变着媒体行业,这让新闻人意识到数据驱动未来的时代已经来临。

    人工智能(AI)是计算机科学的一个分支,它是一种能够模仿人类学习和解决问题过程的智能技术。机器学习(Machine Learning)和深度学习(Deep Learning)都可以视作广泛意义上人工智能领域的子集。机器学习使得计算机能够从数据中学习,而深度学习使用神经网络获得类似人类大脑的分析能力,将机器学习提升到更高的认知水平,使计算机能够更好地学习人脑解决问题时的运作。人工智能中的几个重点领域,包括机器人、视觉和声音分析、自然语言处理等多个维度,无一不和媒体相关。机器人可以协助进行新闻报道,视觉和声音分析可以实现视频和音频的自动化处理,而自然语言处理更是上述应用的基础。

    媒体行业确实正在发生改变。在很长一段时间里,媒体所拥有的数据大多是非结构化的文字、图像、音频和视频,必须依赖人工处理,这阻碍了数据相关技术在其中的应用。但是,随着人工智能和机器学习算法,特别是深度学习算法准确性已经达到与人类相当的水平,很多任务可以实现自动化执行,同时人们还可以从这些数据资产中获得重要的洞察力。Netflix声称,人工智能技术能够实现工作流自动化并减少客户流失,每年可节约10亿美元。

    技术一直在进步,而在许多行业中人工智能和机器学习的整合也取得了成功。人工智能带来的技术可以完成大部分人力密集的项目,计算速度快,可重复性和可扩展性都非常好,从而带来了大规模自动化及无与伦比的效率,这些先进技术在媒体的内容生产、管理和分发中体现出了前所未有的魅力。而现在只是媒体智能化之旅的开端。

    智能化内容生产

    在智能化内容生产中,应用较广的是机器人新闻报道。2014年,美联社就已经开始使用自动化洞察(Automated Insights)公司的wordsmith软件撰写每个季度的公司财经分析。该软件可以挖掘公司财务报告,总结其中的关键要素,然后生成陈述。这个平台每秒钟最多可以生产出2000篇此类新闻,而且由于是对财报的直接分析,出错率非常低,发稿量是人工报道的13倍。同样是在2014年的3月17日,洛杉矶地震发生后的3分钟内,洛杉矶时报的网站就使用机器人Quakebot发出了关于这次地震的第一条新闻。除了这个地震报道机器人,洛杉矶时报还利用数据分析和人工智能技术建立了一个数据库,并在此基础上使用一个程序报道杀人事件,它可以追踪事件并自动撰写新闻。除此之外,美国纽约公共广播电台的NailbiterBot机器人被用于报道“美国全国大学体育协会”的赛事。另一个叫做TreasuryIO的机器人则可以监测美国联邦政府指数。

    中国本土对智能化内容生产的尝试也是如火如荼,其中的领头羊有腾讯、新华社、今日头条等。2015年9月,腾讯财经发表了一篇文章《8月CPI涨2.0% 创12个月新高》,该文章的署名为自动化新闻写作机器人Dreamwriter,可以视为自动化新闻写作第一次在国内得到应用。同年11月,新华社也推出了自己的写作机器人——“快笔小新”,输入股票代码,它3秒钟就能完成一篇财报分析,稿件中大小标题一应俱全,还配有图表等信息。然而,快笔小新只是基于人工录入的知识库和模板,写出的稿件结构单一,内容乏味。2016年里约奥运会期间,今日头条推出了新闻机器人“张小明”。作为第二代新闻机器人,“张小明”除了生成赛事新闻报道,还能智能检索并选择图片,根据比赛结果模仿人类语气等。

    2017年11月腾讯举办的媒体+峰会上,人工智能成为峰会报道的重要参与者。在嘉宾演讲的同时,“腾讯微信智聆”利用语音识别技术实时显示演讲内容,“腾讯翻译君”利用深度学习的翻译技术将演讲内容实时翻译成英语,而Dreamwriter更是以平均0.5秒/篇新闻的速度写出了14篇新闻稿件,还能自动配上现场图片。Dreamwriter还和武汉长江大桥“合体”,利用长江大桥上发出的交通数据,撰写了一篇有文字有图表的长江大桥交通流量新闻。

    机器人新闻的这些尝试,展示了智能化内容生产令人激动的未来。随着传感器、智能硬件和物联网的发展,可以提供机器人进行新闻写作的数据源越来越多,机器人新闻报道的疆界将被拓宽。机器人视觉、图像视频等技术也为新闻摄影的未来带来了其他可能。多种智能技术可以捕获高质量的音频、视频,这种技术同样可以获取新闻事件的照片和视频,甚至通过无人机等设备进行直播,从而实现多种媒介展现方式的融合。

    智能化内容分发

    智能化内容分发,就是指与电商、零售等领域的“个性化推荐”同义,但是更加体现媒体特性的个性化分发技术。这种技术更多应用于新媒体,新媒体的内容分发策略实际上决定了哪些信息能够被用户看到。这是众多内容应用中最容易与算法产生联系的领域之一,是伴随着互联网信息大爆发自然而然出现的。在传统媒体时期以及互联网早期,信息的筛选依赖编辑,决定受众能看到哪些内容的是专业编辑。就像人工与计算机处理的对比一样,编辑的处理能力是有限的,他只能处理头部的20%信息,而长尾则被完全忽视了。使用智能算法进行内容分发最大的优势正在于此。算法可以根据用户的属性、行为、偏好等个性化特征进行推荐,实现“千人千面”,从而彻底解决信息过载的问题。算法可以处理的信息量几乎是没有上限的。

    主流媒体平台中最早使用算法推荐的是Facebook,他们在2006年就开始推出信息流,堪称此领域的鼻祖。Facebook为每个打开其页面的用户呈现个性化的内容,这些内容不仅包括朋友的状态更新,朋友们最近看了些什么,重要的新闻推送,还夹杂了一些广告或推荐文章。Facebook使用算法决定信息流中信息的权重。影响权重的因素也经过了多次调整,包括发布时间(更新的信息),提及朋友的数量,根据点赞、点击、评论、分享等活动分析用户的兴趣点,经常互动的内容可能会得到更大权重,等等。用户能看到的内容都是智能的推荐。在国内,提到新闻资讯的个性化推荐,大家更容易想到的是今日头条。今日头条运用算法、数据挖掘以及机器学习等技术,在用户通过社交账号登录时,对用户数据进行动态挖掘和了解,勾画出用户兴趣图谱,根据用户画像来推荐感兴趣的文章;在用户使用过程中,算法会根据用户的点击、搜索、订阅等行为优化用户画像。在内容方面,今日头条大概拥有220万个兴趣标签,每隔五秒钟后台系统就会自动进行调整并进行推送。

    前面所描述的是媒体根据受众特点进行个性化的内容分发。这种分发可以是文字资讯,也可以是视频内容。对于视频媒体来说,由于视频文件一般较大,不同的收看设备、收看条件下可能会带来不同的体验。ABR编码可以通过将原始文件切分成不同比特率的小块提供给不同带宽下的客户端,而人工智能将固定分块转变为基于场景的编码,它可以学习不同场景的复杂程度,确定所需的压缩级别,根据观众位置、网络拥塞程度、基础设施和带宽的细节优化比特率,提高在线媒体的性能。人工智能还可以进行视频质量评估,这是视频内容分发之前的关键过程,大大减少了内容发布时间。

    智能化内容管理

    无论是智能化内容生产还是智能化内容分发,事实上都依赖于良好的内容管理。视频和音频数据的非结构化特性导致对它们进行分类和整理非常困难,将人工智能应用于内容管理可以有效组织媒体的内容数据库。自然语言处理技术的发展使得媒体可以更好地从文字内容中提取元数据,对内容进行分类、打标签等工作。这些成为自动化新闻写作和自动化内容分发的基础。人工智能是学习推理的技术,计算机需要通过对大量人类写作的新闻文章的分析,才能学会如何撰写新闻,通过深层次的分析挖掘,才能产生更富变化的文章,而不是仅仅停留在模板填空的水平上。同样,新闻资讯类应用进行个性化推荐需要学习如何对新闻打标签,才能获得哪类人更喜欢哪类文章的推荐。人工智能花了几年的时间学习手写识别,然后转到自然语言理解,现在转向了深度内容分析方面。神经网络训练系统为语音—文字转换等技术增加了新的维度,它们不再是简单的逐字转换,而是考虑了上下文和相关性等众多因素。此外,通过学习场景变化,位置参考,语音、面部和物体识别,媒体也可以对视频进行深度分析,这种智能可以丰富视频内容的分类和标记。在这里,人工智能改变了整个内容管理的格局,将本来的手动流程转变为高度自动化的机器工作流程。

    IBM针对媒体推出了IBM Watson Media,作为其著名的人工智能商业应用,IBM Watson Media可以从视频库内容中提取海量数据,包括可视化数据(人或物)、文字和音频提示、情感提示以及地点等其他特性。在美国网球公开赛中,IBM Watson Media的Cognitive Highlight监控比赛场地,分析球速、球员跑动距离及观众的欢呼次数等,并给出了一个“整体兴奋”得分。所有这些数据都由Watson处理。使用这样的工具,媒体可以更好地使用它们的视频库,为受众提供更好的体验,或者为广告商提供更好的匹配。

    半岛电视台已经开始通过面部识别、语音翻译和情感分析来研究他们的视频内容,试图搞清楚视频中的人物是怎么生气的,声音是什么时候发出的以及人们在什么时刻欢呼这样的问题。他们还利用大数据挖掘20年前新闻节目档案中的信息。

    媒体的未来

    长期以来,传统的大众传播媒介一直主导着新闻生产,传播途径遍及社会各个领域,各种新闻信息通过电视、广播、报纸和互联网等大众媒介快速传播到世界各个角落,受众的主体意识无法通过有效渠道得以发挥。随着新传播技术和媒介形态的变革,特别是移动互联网的技术创新和嬗变、移动通信技术的快速发展和普及、社会化媒体的诞生,大众传播形态正在发生革命性改变,如今的新闻信息传播逐渐呈现融合化、碎片化和社会化的传播特性,各种传播技术手段已将大众传播、群体传播、组织传播、社区传播和人际传播充分交织融合在一起。社交网络或社会化媒体为人们提供了在线交流和传播信息的途径,人们在线社会化生活与社会化媒体融合,构成了一张巨大的社会网络且不断演化。这些传播信息都被记录下来并数据化,人们不断在社会化媒体上签到,获取新闻信息和生产信息,体验与分享,借助个性化推荐和新闻信息消费,探知社会、政治、文化生活的方方面面。受众对新闻媒介的需求越来越个性化,也意味着媒介越来越个性化,使得人际传播的影响越来越大,也使得大众传媒媒介的信息发布权开始由集中走向分化,受众的传播权得到了加强。而大数据正是具有社会化媒体融合特征的新传播技术发展的结果。

    抓住大数据这个抓手,智能化媒体的核心可以概括为:软件定义媒体,数据驱动新闻,算法重构渠道,智能创造未来。

    软件定义媒体。目前流行的趋势是“媒体融合”,简单地说,融合媒体的形态可能表现为一个移动端的应用,或者说一个新闻客户端,承担着沟通媒体与受众,传统媒体与新媒体的桥梁。无论是比较重的独立移动应用,还是较轻的微博、微信中的新闻账号,都是以计算机软件程序作为呈现主体。传统电视、报纸、广播和杂志纷纷开设社交媒体账号,开发新闻客户端,打造自己的融媒体应用,或者入驻新兴分发渠道和新闻聚合应用,与原本的体系一起构成新的融媒体矩阵传播体系,在内容分发上体现出多渠道、个性化、差异化的特色。

    数据驱动新闻。大数据时代催生了数据新闻的发展,造就了这种将大数据与新闻叙述手段融合,从数据中发现最新事实的新闻报道形式。数据新闻的生产已经改变了传统新闻的采、编、播、评、报的生产流程,变成了以新闻选题、数据采集、加工处理、可视化呈现和新闻叙事五个步骤构成的新闻产品作业流程,并面向新技术传播平台,借助新的传播手段,以信息图、富媒体、H5应用和在线实时可视化网页等方式广泛传播。而智能化媒体中新闻的生产传播都是以受众为导向的,面向目标用户进行精准的新闻推送和个性化推荐。同时,借助受众的社交关系数据,评论转发等互动的内容分析,受众移动的位置数据,各种目标用户和潜在用户的个人信息、消费偏好、线上行为活动等,采用大数据挖掘技术,实现用户画像和标签化,满足新闻消费的个性化需求和精准营销。进一步来说,传统媒体的数字化转型,各种新闻产品的内容生产都可以数字化并被分析,借助数据挖掘技术,通过机器学习和深度学习算法实现人工智能应用场景,进而进化到智能融媒体。

    算法重构渠道。传统媒体追求更广泛的受众和更有效的传播,在新闻内容生产上更具有优势,也在传统内容分发渠道上占据强势地位,但在移动应用和社会化媒体领域算法技术上往往欠缺,形成渠道短板,往往竞争不过新媒体出身的新闻资讯应用的内容生产者,只能借助具备算法优势的新闻内容分发渠道的新兴媒体。例如今日头条,他们不生产新闻,只是新闻的“搬运工”。这种所谓的媒体是以算法为王,凭借强大的数据资源,丰富的用户画像、智能化的推荐算法和个性化推荐技术将新闻推送到用户手中。广义上,大数据时代的数据算法,已经从传统的统计分析和多变量技术,转变为机器学习和数据挖掘算法,更有人工智能和深度学习算法,带来了全新的算法革命。

    智能创造未来。人工智能和大数据会在未来重塑媒体。新闻写作系统中可以使用更高级的人工智能技术,对人类记者的行为方式建模。我们可以想象一个系统,该系统基于机器学习和人工智能的相关技术监测微博或者推特这样的社交媒体,学习人类记者的监测方式,选择有新闻价值的事件,并根据该事件在社交媒体上讨论的发展趋势自动写成新闻,并选择合适的新闻图片,形成完整的稿件。对应于不同来源的大数据,例如社交媒体、传感器和移动设备,可以形成不同的写作系统。而一个自动化新闻写作系统,会根据每个受众不同的特征,选择不同的新闻事件、不同的生成算法或者算法参数生成不同的文章,并推送到每个人的媒体终端上。当然,这并不意味着人不重要,相反,真正的专业人士的地位从来不会被机器改变。他们可能会在深度报道中发挥不可替代的作用,或者成为系统学习的源泉。这样的智能化媒体,正是媒体的未来。

    今天,媒体呈现的新闻作品,无论视频、图像还是声音、文字,都将成为数据并可借助深度学习技术实现更加智能化的建模。人工智能借助深度学习算法已经可以实现自动驾驶、视频分析、图像识别、人脸识别、语言翻译、语音合成、虚拟客服、自然语言处理等媒介产品形态和各种应用场景的处理。人工智能是在大数据、云计算和深度学习算法的背景下产生的,尽管目前还是弱人工智能,但有不断进化为强人工智能的趋势。人们通过键盘与互联网交流获取信息,用遥控器观看电视的方式,也许部分会借助智能语音盒完成。谷歌、亚马逊、阿里、百度都推出了智能语音盒,天气预报、想听的音乐、最热的新闻事件,智能语音系统都能回答或呈现。借助人工智能技术的认知科学和上述应用场景,必将拓展更多样化的媒介形态和传播渠道,媒介生态将被重新定义,机器人新闻写作必将对新闻内容生产带来巨大影响,VR和AR技术将成为受众新闻体验的炫酷模式,新闻产品的受众个性化需求匹配更加精准,广告营销更加碎片化和个性化。

    (作者沈浩系中国传媒大学新闻学院教授、博士生导师;元方系中国传媒大学互联网信息研究院互联网信息专业媒体大数据与社会计算方向博士生)

    责任编辑:武艳珍

    参考文献:

    ① Lorenzo Zanni. The future is artificial: AI adoption in 

    broadcast and media. https://www.ibc.org/tech-advances/

    the-future-is-artificial-ai-adoption-in-broadcast-and-media/2549.article

    ②沈浩、元方:《“大数据时代”的自动化新闻写作的历史、实践与未来》,《新闻爱好者》2017年第4期。

    ③张维宁、李梦军:《今日头条:继BAT之后的“超级玩家”》,《清华管理评论》2017年第6期。

    ④张涵:《云计算人工智能颠覆视频制作 科技巨头混战娱乐媒体业》,

    http://www.21jingji.com/2017/10-25/yNMDEzODFfMTQxOTAyNw_3.html

    ⑤胡正荣:《智能化:未来媒体的发展方向》,《现代传播(中国传媒大学学报) 》2017年第6期。

智能化媒体与未来