第09版:学术

人民日报图文数据库(1946-2021)

人民日报 2024年07月29日 星期一

返回目录  放大缩小全文复制    上一篇  下一篇

提高人工智能时代口述史研究水平(学术随笔)

杨祥银 《 人民日报 》( 2024年07月29日   第 09 版)

  作为一门古老的学科,历史学的旺盛生命力源于其开放性。习近平总书记指出:“人工智能是新一轮科技革命和产业变革的重要驱动力量,将对全球经济社会发展和人类文明进步产生深远影响。”当前,人工智能在语音识别、自然语言处理、机器学习、计算机视觉、知识图谱、机器翻译、大数据挖掘等方面的突破与应用,不仅深刻改变着人类社会的方方面面,也为历史学的繁荣发展插上了数字翅膀,注入了新的生机与活力。作为历史学的分支学科,口述史也迎来了人工智能带来的前所未有的机遇与挑战。我们要积极拥抱新技术,用创新的眼光和开放的胸襟去探索人工智能在口述史研究中的具体应用路径,把握好人工智能在采集、整理、保存、分析、传播等环节对口述史研究的赋能作用。

  在采集环节,人工智能有望彻底改变传统的访谈模式,实现口述史采集的智能化。以访谈形式采集、整理与保存口述者的历史记忆,并呈现口述者亲历的历史真实,是口述史研究的重要旨归。随着自然语言处理、知识图谱、情感计算等技术的进步,目前已经开发出一批虚拟访谈助理、对话式助理等人工智能系统。这些人工智能系统以人机对话的方式与受访者互动,根据受访者的特点自动生成个性化访谈提纲,并根据访谈进程实时调整问题的内容和顺序。此外,虚拟现实和增强现实等沉浸式技术可以让受访者“穿越”回特定的时空情境,身临其境地重温当年的人和事,为口述史采集营造身临其境的氛围,激发受访者更多的记忆和情感共鸣。

  在整理环节,人工智能在转录、编目和索引等方面显著提高效率和质量,实现口述史整理的自动化。在口述史研究中,对访谈内容的整理至关重要,无论是文献整理、文字整理还是影音整理,都有着一套严格的操作规程。随着语音识别、自然语言处理、知识图谱等技术的发展,口述史整理全流程的自动化处理日益成为可能。在转录方面,智能语音识别程序可以自动将口述音频转化为文本,并进行智能标点、分段、生成时间戳和说话人标记等处理,大幅提高转录效率,同时也降低了人工转写的成本与错误率。在编目和索引方面,自然语言处理和知识图谱技术通过命名实体识别、关键词提取、主题聚类等算法,能够自动识别和提取口述史资料中的主题、关键词、人名、地名、时间等重要信息,按照预定义的规则和标准生成元数据,建立资料目录和索引。

  在保存环节,人工智能改变口述史的保存方式和管理模式,进而提升其安全系数、管理效率与利用水平。海量口述史资料的数字化保存面临诸多挑战,如存储空间不足、检索效率低下与数据安全隐患等。人工智能为破解这些难题提供了新思路与新方法。比如,智能化的数据压缩和存储技术可以大幅降低口述史资料的存储成本,区块链技术等可以为相关资料提供更加安全可信的存储环境;人工智能可以自动提取口述史资料的语义特征,构建多维度、细粒度的索引,实现智能化检索,从而显著提升其利用效率。人工智能的有效应用使得海量口述史资料长期保存和智能化管理更为便利、可行,从技术层面延续了口述史的生命力。

  在分析环节,人工智能提供了新的研究工具和方法,有助于开辟口述史研究的新范式与新路径。传统的口述史研究在分析环节主要依赖研究者的主观解读和历史想象力,着重强调对个体经验的描述和诠释,而人工智能的引入则为口述史分析提供了更多定量分析和数据驱动的研究工具和方法。这些研究工具和方法包括:可以实现口述史资料的智能化解析的自然语言处理技术,能够帮助研究者发现口述史资料中隐性知识和深层关系的知识图谱和语义网络技术,可以帮助研究者从海量口述史资料中发现有价值的模式和趋势的数据挖掘和机器学习技术,等等。人工智能不仅是口述史分析的工具和方法,更是口述史研究范式转变和创新的催化剂,将推动口述史研究从传统的人文解释学范式向数据密集型、技术驱动型的新范式转变。

  在传播环节,人工智能开辟了一系列新的呈现模式与途径,有助于创造更加大众化、交互化、沉浸化的口述史体验。人工智能与数字人文的结合开辟了口述史传播的新路径、新方式、新格局。比如,智能展示技术可以创新呈现方式,沉浸式现实、虚拟人、体感交互等技术的发展有助于打造身临其境的口述史沉浸体验;再如,智能推荐技术可以实现精准传播,人工智能系统可以采集用户的浏览行为、兴趣偏好等数据,利用协同过滤、内容过滤等算法,自动为其推送相匹配的口述史内容,提高传播的精准度和转化率;等等。

  可以预见,在不远的将来,人工智能与口述史的融合将会更加深入,促进口述史研究观念、方法、路径与模式等的全方位创新,让口述史焕发出前所未有的生机与活力。然而,我们也要清醒地认识到,人工智能并非口述史发展的“灵丹妙药”,在带来重大机遇的同时也带来了诸多挑战,比如,如何确保口述史资料的真实性与代表性,如何避免著作权侵犯、隐私泄露、数据滥用等风险,如何避免算法模型的偏见和误读,如何平衡技术应用与人文关怀,如何应对数字鸿沟带来的不平等,等等。这些都是口述史研究在拥抱人工智能的同时必须慎重对待的问题。面向未来,我们既要借助人工智能提高研究水平和创新能力,也要坚守人文情怀和学术操守,以历史学的学理自觉引领技术应用,实现人机协同、优势互补,拓展研究的智能化实践,打造研究与应用的广阔前景与全新境界。

  (作者为中国人民大学历史学院教授)

版权声明

《人民日报》(电子版)的一切内容(包括但不限于文字、图片、PDF、图表、标志、标识、商标、版面设计、专栏目录与名称、内容分类标准以及为读者提供的任何信息)仅供人民网读者阅读、学习研究使用,未经人民网股份有限公司及/或相关权利人书面授权,任何单位及个人不得将《人民日报》(电子版)所登载、发布的内容用于商业性目的,包括但不限于转载、复制、发行、制作光盘、数据库、触摸展示等行为方式,或将之在非本站所属的服务器上作镜像。否则,人民网股份有限公司将采取包括但不限于网上公示、向有关部门举报、诉讼等一切合法手段,追究侵权者的法律责任。

人民日报手机报

移动用户 发送RMRB10658000

联通用户 发送RMRB10655111

  • ios版

  • android版

  • 微信小程序