《新闻战线》概况
日 报周 报杂 志 人民网

机器人写稿的现状与前景

● 耿 磊 《 新闻战线 》(

    写稿机器人不是要取代记者和编辑,而是解放了劳动力,让采编人员将精力集中于更深层次的思考、情感诉求的挖掘。新闻创作中的人文价值将成为人类记者的核心竞争力。

    随着人工智能技术的飞速发展,机器人写稿逐渐进入人们视野。有人对机器人写稿充满期待,也有人对传统新闻记者的未来表示担心。当前机器人写稿已经进展到什么阶段?相较于记者写稿它存在哪些优势,又有什么不足?未来会往什么方向发展?本文通过分析国内外机器人写稿现状,对上述问题进行了探讨。

    国内外机器人写稿的现状

    技术早已产生,近年迎来爆发

    机器人写稿并不是最近才出现的事物,在本世纪初该技术已投入使用。早在2009年,美国西北大学智能信息实验室研发的StatsMonkey系统就撰写了一篇关于美国职业棒球大联盟季后赛的新闻稿件。StatsMonkey通过统计分析,识别出比赛期间发生的重大事件,并总结整体比赛动态,自动编写了一篇体育报道。

    不过,机器人写稿真正迎来爆发则是近几年的事情。随着技术进步,人工智能已经从运算人工智能、感知人工智能逐渐过渡到认知人工智能阶段。与此同时,计算机自然语言处理技术也取得了很大进步,这就为机器人写稿奠定了技术基础。

    从2015年开始,国内外各大媒体就开始逐步拥有自己的写稿机器人了。在国外,《纽约时报》利用Blossomblot系统筛选文章向社交网站等平台推送;《华盛顿邮报》使用Heliograf程序核实新闻的准确性;《洛杉矶时报》智能系统专注处理地震等突发新闻;路透社的Open Calais智能解决方案可协助编辑审稿;《卫报》利用机器人Open001筛选网络热文,生成实验性纸媒产品……机器人写稿已在国外新闻实践中发挥了一定作用。

    在国内,2015年9月10日,腾讯财经频道用自动化新闻写作机器人Dreamwriter,发布了一篇名为《8月CPI涨2% 创12个月新高》的报道,开了国内机器人写稿的先河。此后,新华社推出机器人写稿项目“快笔小新”,阿里巴巴联合第一财经推出“DT稿王”,今日头条推出“xiaomingbot”,南方报业推出“小南”,各种写稿机器人纷纷涌现。

    企业发展较快,媒体跟进及时

    从发展历程来看,无论是国内还是国外,较早开发并应用机器人写稿技术的都是技术实力雄厚的商业企业,尤其是互联网公司,比如,美国著名AI技术企业Automated Insights公司就研发了名为Wordsmith的机器人写稿系统,为美联社和雅虎等媒体巨头提供服务;一些非媒体类公司,如美国好事达保险公司(Allstate)、美国最大的有线电视运营商康卡斯特(Comcast),也都应用此系统编写信息。同样,国内商业媒体,尤其是互联网公司,携技术优势,在机器人写稿方面进展较快。例如,腾讯财经频道的自动化新闻写作机器人Dreamwriter,能根据算法在第一时间自动生成稿件,瞬时输出分析和研判,一分钟内将重要资讯和解读送达用户。而今日头条“xiaomingbot”撰写的稿件,从写作形式和内容丰富度来看,和人类写稿几乎没有差别。

    近年来,传统主流媒体不断加大技术投入,在机器人写稿方面也有突破。如,上文提到的《纽约时报》数字部门开发的Blossomblot系统,能够将大量文章筛选后推送至社交网站等平台。目前,该系统每天能推送超过300篇文章。从国内来看,新华社于2015年11月推出机器人写稿项目——“快笔小新”,是较早开始探索机器人写稿的主流媒体。“快笔小新”主要服务于新华社体育部、经济信息部和中国证券报,用于完成体育赛事稿件和财经稿件的自动撰写。2017年1月,南方都市报社、凯迪网络和北京大学计算机科学技术研究所三方宣布联合成立智媒体实验室,并研发出写稿机器人——“小南”。“小南”的第一篇稿件是春运车票动态信息。2017年春节,人民日报首次尝试运用人工智能,语音机器人“小融”通过人民网及“两微一端”等平台与网友互动,引起关注。

    生产资讯为主,产量十分惊人

    目前,由于技术限制,机器人写作的稿件多为资讯类新闻,但产量十分惊人。

    除了前面提到的《纽约时报》每天通过Blossomblot推送300多篇文章外,美联社使用Wordsmith编写财经和体育方面资讯,每季度可以产出3000家公司财报。据报道,Wordsmith1分钟最多可生成2000篇报道。① 

    阿里巴巴与第一财经联合推出的“DT稿王”主要报道股市异动,平均每天可发布1900篇公告,这是一位资深证劵编辑100个小时才能完成的任务。在里约奥运会期间,今日头条研发的“xiaomingbot”通过对接奥组委的数据库信息,实时撰写新闻稿件。奥运会开幕后的13天内,共撰写457篇报道,涉及羽毛球、乒乓球、网球等大小赛事,平均每天30篇以上,发稿速度几乎与电视直播同步。②

    多准快全,机器人写稿优势明显

    数据海量,规模处理

    大数据和人工智能技术是机器人写稿的技术基础。尤其是随着大数据技术的发展,机器人写稿能力会越来越强。

    据估计,当前全球存储的数据总量以上万艾字节测量(1艾字节=10亿千兆字节),而且仍在加速增长,大约每3年实现一次倍增③。这些数据以各种格式存在,往往难以用传统数据软件进行匹配分析。但应用大数据技术则能够规模化处理这些信息,并在写稿机器人的背后形成一个高度结构化的海量信息网。无论是文、图、音视频还是其他形式的信息,机器人编辑都可以像音乐家排列音符一样去组合、重构。无论天气预报、地震预警还是赛事报道,最终都能放入机器人数据库中,这样的系统潜力巨大,可以构建无限可能。

    信息抓取,精准加工

    机器人写稿的另一大优势就是精准。写稿机器人生产新闻,可以不依赖于现场采访获取素材,而是通过对现有数据、资料进行快速搜集加工编制而成。虽然其对文章的理解深度还远不能和人类相提并论,但在海量数据和强大计算能力支撑下,精准度非常高,这是人类记者难以达到的。另外,在数据量足够大、样本足够多的情况下,机器人写稿可有效避免假新闻出现,因为,机器人写稿依靠的是全网数据,而非一人一言。

    实时监控,快速报道

    写稿机器人用机器代替人类完成对信息源的实时监控,并利用文本解析和爬虫技术实现自动信息抽取,采用算法技术并融合编辑记者团队的经验和智慧,以模板和规则知识库的方式输出稿件。真正达到了对信息的实时监测、实时发布。

    数量庞大,效率极高

    目前来看,写稿机器人能够赢过人类记者,主要是依靠两个“法宝”——“数量”和“效率”。和传统媒体人相比,写稿机器人可以瞬间完成海量阅读、分析并根据互联网活跃点击量数据,瞬时筛选出下一个热点新闻,然后通过后台算法快速合成新闻。总体来看,写稿机器人在速度和数量上有着绝对优势。依靠海量数据和不断演进的算法设计,生成一篇深度报道的时间已经由最初的30秒缩短到2秒以内,其精确度还在不断提升,而且拟人化、情感化的技能也在不断增强。

    刻板僵化,机器人写稿尚有不足

    缺乏独立思考能力

    目前,写稿机器人尚不具备独立思考能力,只能依据既有的数据和事先设定好的程序来写稿,不能像人类一样思考并提出问题。因此,其写作、编发的新闻稿件,也多是简单的资讯类新闻,对于复杂新闻事件的报道则只能通过人类的指导来完成。

    在复杂写作领域,人工智能写稿目前存在两个状况:一是所有AI作品的完成都或多或少得到了人类的指点;二是人给的指点越少,AI的最终作品就越惨不忍睹。

    2016年,日本名古屋大学佐藤?松崎研究室研发的机器人,创作了一篇名为《计算机写小说的那一天》④的科幻小说,获得了日本微型小说奖。该小说架构严谨,但内容呆板,缺乏文学的美感,不过这已经是AI在复杂写作领域的最高水平。值得一提的是,该小说并非由人工智能独立完成。在创作中,人工智能的作用占到20%,80%经过人类的编辑润色。

    写作模式固定、适用面窄

    机器人写稿的核心是利用大数据对信息进行分析,然后套用固定算法进行重新排列组合,再用人们能够接受的或新闻报道要求的格式呈现。其写稿流程分数据采集、数据加工、自动写稿、编辑签发四个环节。技术上通过“三步走”来实现:根据各业务板块的需求定制发稿模板,数据自动抓取和稿件生成,各业务部门编审和签发。

    从这一情况看,写稿机器人仅适合体育、天气、财经等资讯性较强的新闻报道,而对一些有思想性或形式更为灵活的报道则力不从心。

    其主要原因是,目前机器人尚缺三个方面能力:一是归因,二是举证,三是应景。⑤归因,就是描述现象后,分析这些现象的一些脉络,思考究竟是哪些东西导致这个现象;举证,就是提出一个观点后要找几个例子;应景,是指描述完一个过程之后,需要把握画龙点睛的是什么,如何用恰当的词语对此进行贴切的描述。这是机器人写稿遇到的现实难题。

    不会采访,没有情感

    采访,是新闻写作的重要环节,尤其特稿和人物类稿件,采访更是必不可少。联系采访对象,观察对方,用心感受人物,再对大量资料进行整理,做出取舍。新闻稿件的字里行间都饱含着记者的判断、价值观与人文关怀。这些复杂细致的情感工作,机器人尚不能完成。此外,目前写稿机器人还无法进行独立思考,智能写稿系统在深度和个性化上也很难取得突破。正如人民日报副总编辑卢新宁在2017年媒体融合发展论坛上所言:“作为记者,我为地震颤抖,但机器人不会。”⑥

    AI时代,记者将肩负更重责任

    随着自然语言处理、大数据分析等技术的发展,国内外许多媒体已经开始机器人报道的探索与实践。以写稿机器人为代表的人工智能技术,将重塑媒体的内容生产与分发。理性看待科技进步及影响,科学筹划人工智能系统的开发与运用,既是适应时代变化的需要,更是保持发展优势的需要。

    人工智能尚处于初级阶段,暂时不可能替代人类

    目前,人工智能发展水平还处于初级阶段。这一阶段的表现是,各个垂直领域诞生若干超级智能,比如健康和知识问答领域的“沃森”、围棋领域的“AlphaGo”等。这些垂直超级智能可以在特定领域内展现出远超人类的能力,但在擅长领域之外,目前没有任何作为。

    新闻撰稿有简单和复杂之分。信息报道类的新闻撰稿,很大程度上正在被人工智能的新闻写作工具所取代。例如简单地事实组合、情况报告,按照某些既定的格式完成文本写作,这种工作不需要复杂判断,可被机器取代。

    但如果是人民日报重头通讯或“任仲平”等深度文章,或需大量采访为基础,或需在原始素材之上,发挥作者的归纳和推理能力,提炼出相对复杂的逻辑结构,设计出最适合主题的表述形式。这些工作,每一项所需要的思考时间,都远远不止5秒钟。有能力撰写“任仲平”等类型稿件的记者,在未来很长一段时间内,根本不用担心自己的工作会受到人工智能的威胁。

    时代呼唤更有深度的记者

    理性看待写稿机器人和人工智能,有助于推动新闻业转型发展。现阶段,机器人可以胜任相对简单、重复、机械性的信息发布,从这个层面来看,机器人可将记者编辑从单调、重复的工作中解放出来,去关注更复杂、更需要人类思考的现象与问题,去做更有意义的事情。但同时也要看到机器人创作的稿件,难以全面反映社会文化和意识形态领域的各类问题,更缺乏打动人、有情感的细节。大量复杂、跨界、有深度、情感细腻的新闻生产仍需要人类记者。这意味着,具有专业经验和复杂采编技能的记者编辑对于新闻行业仍然起着支撑作用。

    中国人民大学新闻学院教授匡文波认为,具有创新能力的记者将成为人工智能时代的强者。⑦人工智能的出现,其实为人类记者提供更上一层楼的动力和机遇。对于每一个媒体人来说,只有更深入地了解新闻行业以及人类获取信息的渠道、思考方式的本质,加深人工智能领域的人文探索,才能使人工智能更好地为我们所用。

    但机器人写稿毕竟为新闻工作者敲响了警钟。随着人工智能技术的进一步发展,作为一名记者,如果不能做到对新闻事实加以深度分析和独立判断,迟早会被机器人取代。从长远看,这种趋势对促进媒体加快转型升级、提升整体业务水平来说,是件好事。

    人机协作是必然趋势

    写稿机器人会给新闻行业带来冲击,但更多的是发挥技术的辅助功能。媒体要依靠科技的力量,但不能成为科技的奴隶,数据只有为人类所用才有价值。未来,在各个垂直领域将出现若干超级智能。这个过程中,人机协作是必然趋势。未来的新闻稿背后也许会站着一个人类记者和一个机器人记者,透过不同的视角看世界。

    新闻内容生产将更加智能化

    首先是新闻线索获取将会更快。运用最新的人工智能技术,可以通过网络爬虫获取实时信息,然后进行内容特征词的抽取计算,快速提取发现新闻线索,再通过多渠道验证和排重等,排除无效内容,判断消息真伪,从新闻时效性和真实性上提升内容质量。

    其次是信息整理效率将会更高。通过人工智能可以快速提取核心观点、事件发展趋势、舆论情感导向,分析事件传播路径,让新闻生产者迅速了解整个事件的来龙去脉,提供创作思路,从而缩减创作时间,升华新闻价值。

    最后是内容创作能力将显著提升。写稿机器人的存在,并不是取代记者和编辑,而是解放了劳动力,让采编人员精力集中于深层次的思考、情感诉求的挖掘,新闻创作中的人文价值将成为人类记者的核心竞争力。

    (作者单位:人民日报社研究部)

    责任编辑:武艳珍

    注释:

    ①彭茜:《2016年普利策奖揭晓引发“危机”话题 “还好,摘获奖项的仍是人类”》,文汇报2016年4月20日。

    ②敬慧:《机器新闻写作热潮下的传统新闻生产冷思考》,《科技传播》2017年第20期。

    ③《“鹅毛笔”:新闻杀手》,国际金融报2015年12月14日。

    ④《机器人创作入围日本文学奖 人工智能还能写小说?》,扬州时报2016年3月25日A10版。

    ⑤白硕:《未来是属于智能媒体的》,半月谈网2015年12月21日,

    http://www.banyuetan.org/chcontent/fzzl/fzrw/20151221/174656.shtml。

    ⑥卢新宁:《“内容+”将成为媒体融合关键词》,《新闻战线》2017年9月(上)。

    ⑦匡文波:《人工智能会取代记者吗?》,《新闻论坛》2017年第1期。

新旧年交接之际看传媒业现状与走势
2017年新型主流媒体发展概况及展望
2017年中国新媒体发展状况、特点和趋势
对新媒体发展趋势的几点思考
在学习中求生存谋拓展
2017年广播影视产业发展情况分析
政策与市场的双轮驱动
2017年世界政治中的媒体呈现
2017年中国版权发展及热点问题回顾
2017年媒体新技术发展与应用综述