摘要:随着5G、区块链、人工智能、虚拟现实等技术的发展,传统内容的传播机制、路径和形态发生巨大变化。大数据技术不再是简单的数据统计,意味着智能判断力、信息收集力和高效分发力。大数据以挖掘、聚类、测算、传输,输出个人化的用户偏好和情感态度数据,给电视节目选题、受众定位、内容制作、传播营销等环节带来多种可能。本文通过对大数据挖掘的应用机制探索,探讨互联网大数据如何助推电视节目模式创新及开放性建构,促进电视产业健康发展。
关键词:大数据挖掘 电视节目 互动运营 个性化推荐
融媒时代,大数据不仅是技术属性,更被赋予了数字资源属性。正如数据专家舍伯恩在《大数据时代》中的阐述,未来数据就像土地、石油和资本一样,成为经济运行的根本性资源。
大数据具有五大特点:巨量、高速、 多样、低价值密度、真实性。大数据的价值重点不是数据体量的巨大,更在于多元和交汇。不同品性数据集的连接,在描述特定对象的属性与状态的同时,扩充了价值增值的内外部区间。大数据所具备的精准智能价值匹配的特性,将人与人、人与物、物与物之间的关系进行崭新的升级重构,在这样的作用之下,传媒社会整合、塑造意识形态、集成社会经济的空间也在不断延伸。①
作为一种新的思维方式和新的资源介入到内容生产,大数据采集、挖掘、存储、清洗、分析等环节,对于电视节目产出的创新化发展,拓展了价值空间和增量效应。特别是个性化内容推荐算法,改变了传统电视节目的制作理念和文本类型、受众结构和传播机制,形塑了电视节目运营新模式。而大数据改变电视节目发展的底层逻辑在于,大数据类聚、分析出不同节目的用户在哪里,用户喜欢的是什么,怎样的元素组合能够投用户所好。
广义上,网络数据既包含“大数据”,同时也存在具有高价值的“小数据”。因此,电视节目的定位和策划应该确定数据类型和应用范围。互联网发展经历了门户网站、搜索引擎、社交媒体的演化,因此网络数据分为三个发展阶段,且三个阶段呈非线性发展并互有交叉,共同构成了可供电视节目制作的数据来源。
第一阶段:用户单向行为数据。在门户网站主导的时代,网络数据多以用户的单向行为为主,平台方具有较强的议题设置能力,视频节目在网站中的位置在很大程度上决定了其热度和关注数量,在此阶段网络数据是被网络平台“策划”和“设置”出来的,受众的自主选择行为比重并不大,当然这种现象在当前依然存在。该阶段的网络数据主要包括:用户触媒习惯数据、用户的平台偏好数据和用户基本人口统计学变量数据(此类数据有时候存在较多的缺失)等。
第二阶段:用户内容偏好数据。在搜索引擎时代,用户的偏好行为和自主选择的需求被充分释放,精准化检索技术很快在视频网站得到应用,视频网站用户的内容偏好数据快速累积起来,建构历史数据库,为内容产品前期后期传播计划,尤其是广告投放力度、地区投放、人群定向投放等提供数字依据。此外,搜索引擎也逐步开始涉及视频内容的检索。在这一阶段,用户开始逐步摆脱门户网站的单向推送,网络视频的相关数据主要以“内容偏好”数据为主,同时个性化的收视习惯、内容关联等数据作用开始崭露头角。
第三个阶段:关系数据与口碑数据。在互联网融媒时代,社交媒体以前所未有的速度将网民快速细分,有研究指出:社交媒体时代的互联网具有“同质化筛选”的特征。基于网络社交关系网络,对视频的口碑、分享行为、收视行为都产生了与以往不同的特征,同时也改变了视频节目传播的根本路径。在这一阶段,网络数据主要以“关系数据”和“口碑数据”为主。这类数据的累积和转化深度透视出电视节目受众的传播渗透力和情感态度。②
基于此,本文试图从大数据驱动电视节目的智能化生产与决策、大数据影响电视节目互动化运营与进行式优化、个性算力增强电视节目的共性覆盖与个性区隔等方面,具体分析大数据如何助力电视节目运营新模式的搭建。
大数据驱动电视节目的供需适配与智能化决策
“数据挖掘,是通过分析大量数据来揭示有意义的新联系、趋势和模式的过程。与一般的数据处理技术不同,数据挖掘针对的是零散的信息——非结构化信息,如网络言论、图片和视频。”③也就是说,有了数据并不意味着可以直接进入生产环节,清理和分析数据,洞悉各数据源之间的关联性,识别数据的多样用途,发现数据变化的隐含趋势更为关键。因而,数据挖掘的过程更是发现内容可输出点和价值点,剖析数据背后的内容意义,将非结构化数字信息整合为结构化内容的过程。
大数据驱动电视节目建构供需适配型生产模式
大数据强化技术属性的同时,同样蕴含着大量的内容线索、节目选题和信息价值,采集数据和挖掘数据正在逐渐取代传统信息采编方式。生产主体不再仅限于传统意义上的编辑群体,文本集体创作者及专业电视平台机构。
大数据的广泛应用,首先影响了电视节目生产运作组织的变革。随着数据可获取性的增强,数据获取渠道的多元化以及数据分析开源软件的普及推广,电视节目生产主体的去职业化是显性变化。PGC(专业生产内容)、UGC(用户生产内容),甚至是MGC(机器生产内容)包括图文视频、受众舆情评价等数字化生产资料,成为电视节目内容来源和重要素材,带动节目生产主体的多层次化发展。
从电视节目生产流程上看,大数据的测算前置,重塑了电视节目的生产决策模式。在传统电视节目策划中,主创团队首先确定节目主题、设定展开方向,根据主题主旨广泛搜集文献和数据论证,延展内容和续写文本。在这一模式中,数据承担辅助证明的角色,去印证某个预测结论的可行与否。大数据时代的电视节目生产制作,数据测算结果前置的基础上,大数据在节目整合中成为新的主体性力量,并从顶层消弭电视节目市场占有率的不确定性,以供制作团队做出适配性决策,引领个性化定制式内容的产出,这种新生产模式即为算法节目制作。
首先,通过广泛采集不同维度、不同层次和不同属性的多量用户数据,为内容创作储备信息资源。其次,以数据贯穿创作生产的垂直流程,避免内容密度过高而导致价值稀释和资源浪费,植入减法思维,实现产能克制与去产能化生产。最后,借助大数据汇集海量样本,采取数据挖掘与统计的量化研究方法,使得数据本身成为内容一部分。从大数据的关联中,挖掘叙述线索、提炼选题设置、洞察民意测验,从而填充信息价值和意义是节目样态创新的主流方向。
从央视与百度、新浪、QQ大数据、亿普赞等数据测算平台合作,推出“据说”系新闻节目——“据说春节”“据说就业”“据说清明”“据说出行”,可以看出大数据在民生、汽车、金融等垂直领域的内容孵化。腾讯视频推出的辩论类新闻节目《事实说》,基于腾讯新闻客户端的200万用户量化调查和拍客街采用户偏好,用户调研数据被纳入节目中,成为节目中数据派嘉宾观点表述和验证结论的依据。
品好数据为电视节目生产提供智能化决策
从国外案例来看,由Netflix奈飞自制的原创剧《纸牌屋》成为大数据挖掘下的自制电视剧。从在线租赁服务提供商转为电视剧制作平台的奈飞,重视数据对影视内容转化趋势和拿捏观众口味的预测功能,以数据库逻辑将每个用户的观看喜好类型,通过分类整理、分析和整合,梳理出了大约2000个“品味集群”④,原创剧集《纸牌屋》的市场成功,是品味数据库价值的生动佐证。
此外,奈飞自主设计推荐引擎 Cinematch,设置评级功能,以排序算法、相似视频排序算法和趋势排序算法洞察用户倾向:为每位订阅用户提供个性化片单,通过“猜你喜欢”的功能实时推送给用户;通过数据捕捉单个用户每一次观看剧集的瞬间行为的微变化,暂停节点、次数,快进与快退的次数等操作行为均被纳入数据库。
Netflix数据库包含3300万用户的收视选择和播放动作、 400万条舆情评论、300万次主题搜索,有700名数据专家包括数学家和工程师,对每日的数据快速挖掘和分析,不断精准推送用户喜好的同类型内容。品位集群数据、数据排序算法和趋势排序算法重要价值在于,更精细地处理数据与用户之间的关系。从用户显性和隐性行为中挖掘潜在需求,预测节目的市场接受度和流行趋势,进而使电视节目达成智能化决策、实验性创新和运营布局。
大数据影响电视节目互动化运营与进行式优化
大数据驱动互动化运营
大数据不是单一静态的,而是多元流动的。这决定了用户在参与内容创制过程中,能够输出可信度和客观度兼具的数据表达。这种可信度建构了标准化模型,让制作者更为重视用户行为数据的采纳。一方面以数据推演观看心理决策过程,追踪观众行为数据,挖掘隐藏的兴趣点和新需求;另一方面,实时关联个性算法数据,形塑了恰当的文本载体或内容呈现形态,让用户真正参与到节目生产与优化过程。
用户数据融入节目运营中,形塑节目的叙事转向和价值转化,增强用户体验的真实感、沉浸感和交互感。在这个过程中,用户的主体参与性和个体想象力得以激发,调动受众的自我展示、自我呈现、自我选择,用户参与行为既是精准数据的过滤器又是精准数据的催化剂。在一些互动视频节目中设置互动点和互动形式,用户可以自由选择剧情走向。在《奇葩说第六季》的营销环节,爱奇艺极速版APP定制首页频道专题页,通过40位选手独家Vlog预热营销,设置11个内容板块,发起互动板块UGC内容征集活动。用户能够与参赛选手互动,累计54709人参与定制化辩题PK互动,超过100万用户参与复活投票。
用户的每次点击和输入,交互行为和体验状态,都会即时记录在互联网数据库中。数据库的出现使信息不再是单次接收的“快速消费品”;进入数据库的信息往往会被多次搜索或使用。网络超文本传播所形成的“集体记忆”也不断增长,新的事件的发生往往会成为引发“旧情绪”以及对旧闻的记忆,对信息的接收、消费和使用不再是单次的行为而成为多次累积的效果。这种鲜明的“长尾”效应使节目的价值链得到极大的拓展和延伸。⑤
一方面,个人化数据的类聚,是实现千人千面的个性化推荐和精准化传播的前提和基础;另一方面,用户视角成为叙事的第一主体,拓展了节目的叙事空间和叙事价值,为同类节目的制作者优化节目提供了数据参照和策划优化。此外,用户对于节目主旨立意的认知度和接受度存在差异,在与节目的自由交互中,能够影响用户的价值观念和行为方式,形塑了节目传播的社会价值和人文价值。然而,目前大数据驱动互动化运营形式尚未成熟,交互性运营模式的前沿应用仍然有局限,特别是互动程度、互动效果和互动体验等层面的优化路径仍需深入探讨。
基于受众行为和情感数据进行式优化
在大数据驱动下,受众呈现出偏向行为特征与非线性、可预测、可视化特点,可在节目分发时,开展进行式优化,包括优化剧情,优化风格,优化人物,品类优化和质量优化等。
具体来说,收视行为指标体系、关键词检索偏好数据和网民定向情感分析等三组数据支撑节目优化:
收视行为数据优化节目。视频网站的点击量、用户收藏、转发等行为,节目类型及点击量的细分交叉数据、受众的地域、收视终端设备等数据,综合构成用户定位的基础指标,通过网页抓取或与视频网站的数据融合。
关键词检索偏好数据优化节目。充分利用搜索引擎的各类指数数据,例如百度指数、Google Index等,可以获取网民对某些视频节目的检索偏好,可以获得网民检索网络视频节目的关键词组合规律。中央电视台新闻频道相继推出数据新闻《新闻1+1》节目,集中报道了2020年疫情初期,武汉当地民生状况和战疫情景的搜索峰值数据。从中可以看到武汉市民对于通行证、通行证办理、团购、跑腿、云课堂、84消毒液、剪头发、教程、理发视频等高关注议题。这些数据均能直观了解网民的生活需求排名,关注焦点是什么,引领节目直接照见现实,赋予了节目宏观解释力和影响力,在传播中优化了节目立意。
舆情定向情感分析指标优化节目。用户的情感态度数据分散在各类平台,特别是社交类媒体。针对特定内容抓取网民的讨论、评论内容,经过数据挖掘、聚类和清洗后可进行系统的内容分析,进而获取特定受众群体的情感和态度数据作为更精准的定位指标。
《奇葩说第六季》话题阅读量达4.4亿,热搜贡献量76个。《奇葩说》节目组通过官方微博、微信公众号、知乎以及“百度知道”等自媒体渠道,以用户思维的在场化和具象化,量化出网友最关注、最感兴趣、最有热点的辩题。最终议题区间集中在爱情选择类、友情选择类、亲情选择类、工作选择类、社会热点类、虚拟想象类,体现亲民性、现实性和定制性。
个性算力增强电视节目由共性覆盖向个性区隔
移动智能终端的快速普及创造了最具规模化的互联网传播体系,而移动读屏的便捷催生了信息需求的个人化。从需求端来看,可分为整体性内容需求市场(人们的共性需求)、群体性内容需求市场(人们的分众化需求)、个性化内容需求(人们的个性化需求)。由于互联网逻辑下的个体信息化是采取原子式的数据化方式进行的,即以用户在互联网上每次点击和输入为基本单元汇总、分类、加权、建模,个人信息数据输入的形式和质量,既决定了信息个人化的输出形式和质量,也准确建构目标人群或个性意愿的数据模型。⑥预测需求转化方向、激发需求、区隔需求,从覆盖共性需求转移到捕捉个性需求。
从目前来看,个性化定制是电视节目受众的主流趋势,而定制化内容亦有规模化的取向。当前,“千人千面”的数据推荐机制已经全面渗透到电子商务、新闻、网络视频、搜索引擎等方方面面。国外一流视频平台YouTube、Netflix等已将大数据分析方法和个性化数据推荐机制介入到视频节目的生产与传播,国内的视频网站仍然处在持续优化和发展阶段。
此外,个性算力增强体现在分发的“关系增强”和“场景增强”,社交链传播的关系型分发在个体性内容需求市场上扮演着更为偶然性、场景性、低频度个性需求的满足者的亲密角色。⑦
这意味着传统的黄金位置、黄金时段、名人背书模式将不再起主要作用,虚拟社群、圈层文化和社交连接将会很大程度上影响受众决策,激发用户参与公共事务和公共议题的兴趣。
对于未来的电视节目运营主体而言,数字化评估是电视节目传播的最关键优势,而数字化评估的实现则基于评估数据模型和评估数据库的建立。无论是主流媒体还是商业平台,互联网视频平台或专业电视制作机构,长视频平台以及短视频平台,将更加重视数据科学并强化算法推荐。基于用户行为测算结果和个性算法推荐方向,全品类互动式运营或成内容平台标配。
就电视节目而言,“千人千面”技术的全网平台普及化会产生长效影响:首先,在高并发、高兼容、高速率的移动信息技术的支持下,主流价值取向下的个性算法推荐,是电视节目运营传播的重要探索方向。其次,受众收视习惯和内容偏好日趋固化,甚至有可能出现受众极端偏好于某一类型内容的情况,造成文本类型的同质化和窄化现象,以及目前引发关注的“信息茧房”效应。同时,算法推荐预测需求和激发需求,引发数字伦理和公共信息安全问题,值得行业警惕并持续探索大数据背景下,电视节目运营的风险规避措施及弥合方案。
(作者谢炀系北京大学新媒体研究院博士生,宋欣欣系CC-Smart新传智库研究员)
责任编辑:杨芳秀
注释:
①喻国明:《未来传媒进化的大趋势及VR、机器人写作与知识付费》,《教育传媒研究》2017年第4期。
②王朋进:《算法创作:大数据时代电视节目创作的新模式——以〈纸牌屋〉为例》,《中国电视》2017年第2期。
③卜晨光、高贵武: 《大数据背景下电视节目的发展与创新》,《电视研究》2014年第4期。
④司若、黄莺 :《从Netflix看大数据如何影响影视创作|探元计划》,腾讯探元计划,腾讯研究院2021年2月2日发布。
⑤大数据新闻:节目创新战略,2015年10月9日,https://mp.weixin.qq.com/s/y7qM6V95RIonNpzz3oe-hQ
⑥李凌、陈昌凤:《信息个人化转向:算法传播的范式和价值风险》,《南京社会科学》2020年第10期。
⑦喻国明、丁汉青:《传媒经济学教程》(第二版),中国人民大学出版社2020年版。

