《新闻战线》概况
日 报周 报杂 志 人民网

人工智能构建传媒新业态

——以南方财经的实践为例

赵随意 陈 燕 《 新闻战线 》(

    南方财经积极开展“媒体+技术”的跨界实践,用国际领先的行业技术重构生产方式和业态,以人工智能为驱动,与各行业领先的技术公司合作。目前已开发人工智能语音主持人、南方财经全媒体舆情服务平台、全媒体平台机器人写稿系统、智能化视频制作合成系统、视音频传播监测分析系统等应用。

    现阶段,计算机技术已从网络技术阶段发展到智能技术阶段,人工智能已经成为引领技术变革的下一个“风口”。如何将媒体转型与人工智能相结合,是学界业界思考的焦点。

    南方财经全媒体集团(简称“南方财经”)于2016年11月在广州成立,是慎海雄任广东省委常委、宣传部部长时一手打造的,是广东深化文化体制改革、加快媒体融合发展的重点项目和文化强省、媒体强省的重要探索,目标是建成广东省直主流媒体和媒体融合发展的标杆。慎海雄有针对性地提出了“国家利益高于一切,用户体验检验一切”的发展要求。

    两年来,南方财经迅速完成“两报两台三刊四网两微一端”全媒体布局,成为媒体规模、综合实力和影响力位居国内前列的财经媒体;积极服务国家战略,不断加强传播手段建设,为我国积极参与全球经济治理体系提供舆论支撑。为此,南方财经坚持“创新为要”,对标国内外知名财经媒体巨头,大胆开展“媒体+技术”的跨界实践,用国际领先的行业技术重构生产方式和业态。2017年6月,南方财经启动“全媒体指挥中心”建设,一期建设于2018年3月投入使用,目标是建成国内最先进的策、采、编、发平台,为集团全域子媒体板块新闻报道的全生命周期提供技术支撑,构建一个全媒融合的生产模式和管理环境。我们以人工智能为驱动、与各行业领先的技术公司合作开发适应我们的特定需求的应用。

    人工智能语音主持人

    在全媒体指挥中心,我们因应技术发展趋势,采用了“语音合成技术(Text to Speech,简称TTS)”,运用声学、语言学、数字信号处理、计算机科学等多学科原理,实现文稿的一键式智能语音输出转化,让机器像人一样开口说话,替代了原有的配音播报作业流程。TTS技术在媒体的应用始自2017年,华盛顿邮报、BBC、金融时报等已有相关实践。传统的TTS技术基于电子合成音,情感体验和传播效果不佳,为此,我们与语音合成技术行业领先的科大讯飞展开合作,创造性地运用以真实人声为模本的TTS技术,采用最先进的中文文本、韵律分析算法和大型语料库的合成方法来实现文稿转换成自然语音的新闻生产方式。

    经过紧张筹备,2018年3月1日,南方财经“人工智能语音主持人”在全媒体指挥中心正式上线,首次采用南方财经主持人俎江涛的虚拟音库进行了新闻信息播报。如今,“机器人俎江涛”已成为南方财经旗下股市广播频率和新媒体平台“21财经”APP的一名正式播音员。运用人工智能自动生产和播报财经新闻,既可提高报道的及时性、准确性,避免人为因素造成的差错,又可将采编一线人员从重复繁杂的动态新闻采访和编播工作中解放出来,将更多的人力和精力投入到深度报道、数据分析、趋势研判等创造性工作中。

    这次跨界实践,是中国媒体领域人工智能应用的一次成功探索,南方财经也成为全国首家应用真人语音智能生产新闻的媒体机构。目前,南方财经全媒体指挥中心在已搭建的“人工智能语音主持人”技术基础上,正与国际最前沿的3D模拟动态技术科研团队合作,采用全息影像技术模拟主持人进行节目主持,将实现从智能音频播报到智能视频播报的产品迭代。

    全媒体舆情服务平台

    对于新闻机构而言,组织力量开展信息汇集整理和分析,从海量数据中发掘舆情苗头,及时防范舆情风险,既是履行新闻媒体所肩负的职责,也是实现业务转型和业务拓展的有效途径。

    南方财经全媒体指挥中心在2017年搭建了“南方财经全媒体舆情服务平台”,通过人工智能分析处理,可在2分钟内快速获取各类门户、论坛、自媒体的相关敏感数据,并可通过办公区域的可视化大屏,实现动态舆情展示,便于进行快速预警、研判、应对。

    该技术应用主要包括三个方面:

    一是数据的智能采集。通过网络工具自动对网上数据进行抓取并存储在本地数据库。数据必须包括各种合法网站和社交平台,并能够进行信息源差异化、智能化处理,实施多样化采集策略。采集到的数据需要自动过滤掉电商、广告等垃圾信息,对相似文章进行归并处理,抓取有意义的跟帖、回复等内容供新闻策采环节使用。

    二是大数据的分析和智能处理。对采集到的大数据的关键词、标注等语言、文本特征进行分析,形成组织化数据,然后通过数据模型进行分析,从多个方向提供包括热点信息自动推荐、重点目标实时监看、核心主题监测分析等信息,实现自定义主题跟踪、专题汇聚、热点榜单、路径分析、走势分析、新闻溯源、重要人物的热点追踪、全景追踪、事件子话题分析等,对舆情进行多种方式的实时预警。

    三是新闻稿件的影响力分析。根据发布渠道构建传播效果分析模型,智能跟踪和自动分析各个渠道的传播影响力。通过转发量、浏览量、PV值、原创数、首发数等指标的统计分析,形成多维度评价指标,智能分析挖掘集团稿件风格(语义分析、情感分析)、稿件属性(社会新闻、财经新闻属性)与稿件传播影响力的关联性;同时针对特定事件,实现对标杆和竞品的事件关注度的对比分析,客观反映新闻采编效果,为决策层全面掌握舆论动态,做出正确的舆论引导和运营决策提供分析依据。南方财经全媒体集团计划在移动端应用舆情监测服务,正在与相关技术厂商共同进行技术开发。

    智能机器人写稿 

    机器人写稿并非新近出现的技术。2009年,美国西北大学智能信息实验室研发的StatsMonkey通过统计分析整体比赛动态撰写了一篇关于美国职业棒球大联盟季后赛的新闻稿件。从2015年开始,《纽约时报》、《华盛顿邮报》、路透社、《卫报》、腾讯财经频道、新华社,甚至阿里巴巴、今日头条等纷纷推出机器人写稿。

    机器人写稿的核心是自然语言的处理,同时涉及数据挖掘、机器学习、搜索技术、知识图谱等。机器人写稿的生产方式可归纳为“三步走”:根据各业务板块的需求定制发稿模板,数据自动抓取和稿件智能生成,各业务部门编审和签发。目前对有思想性或形式更为灵活的报道,写稿机器人显得力不从心,因此,南方财经全媒体平台机器人写稿只在两类新闻报道中使用:

    一是财经新闻类。针对公告、快讯、经济数据、人民币汇率、沪深市场行情等业务建立模板库,采集上交所、深交所、上海外汇交易中心等网站的公告信息以及市场行情,按照其发布频率,自动采集和生成相关稿件供编辑参考。 

    二是事件监测类。针对工业效益、重组信息、IPO批文、自然灾害、民政信息等相关信息,采集国家统计局、央行、证监会、银监会、保监会、国资委、外交部等的数据信息自动生成稿件。 

    视频自动合成制作 

    视频新闻已经成为当前不可忽视的潮流。2017年12月31日,Wibbitz对美联社2017年头条新闻进行了自动化剪辑,生成了一个3分钟时长的视频,超过一百万人观看了这个视频,为美联社带来了近120万美元的利润。如今,人工智能技术可实现文本、视频、音频间的互相转化,媒介融合进一步加强,智能化视频制作已成为媒体发展的方向之一。

    智能化视频制作技术主要包括三部分:一是内容分析,用户输入一篇文章、一个链接或者一个关键词后,系统会自动将相关新闻内容拆解为一个个内容片断;二是素材推荐,通过人工智能服务,场景分析,依据内容片断自动推荐对应的图像内容、视频内容、文本内容;三是自动合成,通过视频合成技术,配以人工智能合成的语音系统,直接向用户提供多个版本的视频,交由用户选择、确认。

    目前,南方财经全媒体集团已具备以上3部分技术基础,正在开发视频自动合成制作系统,预计将于2019年在南方财经全媒体指挥中心二期上线。

    视音频传播监测分析系统

    在媒体融合的大背景下,媒体的“新旧”实质上只是传播媒介的不同。每一次新的传播媒介技术手段的更迭,都对媒体传播形态带来深远影响,有价值的新闻内容的传播方式正在以视觉化、人性化、即时化、互动化、社交化、移动化的趋势高速进化。如何适应新形势新要求,聚焦高质量发展,拥抱新技术,在富媒体内容网络传播监管层面运用好人工智能及大数据技术,确保传播内容具有正确的政治方向、舆论导向以及价值取向,为媒体品牌树立良好的公众形象,扩大媒体传播的影响力,成为当前媒体行业发展的重要探索方向。

    目前市场主流技术体系中,面向新闻传播效果的监测分析系统较多,主要监测对象是图文类报道,而视音频内容的传播监测及效果分析是富媒体监测技术的空白。南方财经全媒体集团 “视音频传播监测与分析系统”应用百度AI能力图谱中的视频内容分析VCA(video content Analysis)技术,对南方财经旗下优质原创音视频内容进行智能化分析处理,从语音、视频、文字、公众人物、物体、场景等多个维度进行自动识别、交叉比对和自然语言处理,不仅能够结构化地输出视频的场景、公众人物、地点、实体和关键词等原始属性标签信息,还能够运用碎片化和标签化的智能技术抽取所有类型的稿件知识,通过领域分类、多维聚类、智能关联以及自动专题汇聚等方式将其整合成相互关联的决策知识,形成媒体资源中心潜在的知识关联网络。

    在内容传播链中,系统结合互联网大数据定向抓取技术、视频内容审核VCR(Video Content Regulation)技术、视音频检索比对技术,实现多种传播渠道的传播内容监管、效果监测及质量评估。在数据抓取方面,利用百度强大的互联网数据采集能力,实现多地域、多终端主流媒体渠道的数据高效获取及定向采集;在视频内容审核方面,大大优化了内容监管手段,提升了视音频内容的监管效率,最大化保证了传播内容的正确性;在视音频检索比对方面,实现基于基础图像或图像序列(视频)的特征值提取,并与监测目标获取的内容进行相似度比对,实现对视音频内容的网络传播定向监测。

    目前,南方财经全媒体集团“视音频传播监测分析系统”的建设工作已经完成了技术遴选及应用模式的探索工作,即将步入实质性的系统研发阶段。系统将持续跟踪南方财经全媒体集团旗下媒体核心价值内容的传播情况,实现传播影响流的分析挖掘,并在实践中逐步完善新闻热点传播影响力数据模型和指标体系,及时把握受众群体的舆论演化趋势,输出南方财经全媒体集团核心内容的全网传播分析报告,帮助旗下媒体筛选最优质的传播渠道进行发声,切实提高传播效率。

    对传统媒体人工智能的几点思考

    在实践中,我们深刻感受到此轮人工智能技术革命为媒体发展带来的驱动能级与未来希望。

    媒体运用人工智能技术不是简单的替代人,而是解放生产力,调整生产关系。我们大面积运用人工智能写稿、剪辑、播音和精准传播等技术手段的目的并不是简单替代人,而是更大能量地解放生产力,促进生产关系的改变和调整,把更多人力和资源投入到一线采访、撰写评论、关注深度报道、策划重大活动等工作中,把简单的一般性工作和具有深度算法的操作交由人工智能去做,由此提高效能与效率、强化数量与质量。

    传统媒体在大数据和人工智能方面思维僵化,人才匮乏。传统媒体管理者对人工智能和大数据系统建设的全面性、先进性、前瞻性和预判性认识还有待提高,普遍存在着对实用性、操作性和传播性不到位的问题。传统媒体缺乏大数据和人工智能研发方面的技术人才,我们的技术工程大多数都是第三方服务性质,自我主导性与迭代升级存在诸多问题。

    传统媒体人工智能的应用差异化不够,同质化现象严重。由于没有自我科研队伍,所以媒体所使用的人工智能产品差异化不够,缺乏“从0到1的创新精神”,达不到“与其更好,不如不同”的差异化境地。从1到N的模仿和克隆现象严重。缺乏媒体的独有性和针对性,同质化是我国媒体人工智能一大问题。

    传统媒体对大数据和人工智能普遍投入不足,处于进退两难境地。目前,多数传统媒体已是举步维艰,管理者已经认识到大数据和人工智能对今后发展的重要性,只是没有经费投入人工智能领域,即使投入了也无法即刻得到回报。但是,媒体如不纳入大数据和人工智能等新科技功能,今后的持续发展和希望更加渺茫,等于放弃未来。

    媒体在大数据和人工智能的发展方面,有条件利用条件高水准高起点高质量投入建设,无条件创造条件根据实际情况也要有一定投入,因为,这一举动关乎媒体未来是否可以持续发展和跨越式发展。世界上唯一永恒不变的就是“变化”。媒体融合、转型升级和人工智能等则是“变化”中的永恒。

    (作者赵随意系南方财经全媒体集团总编辑,陈燕系该集团总编室监制)

    责任编辑:杨芳秀

展形象的新探索
人工智能构建传媒新业态