第11版:文化

人民日报图文数据库(1946-2021)

人民日报 2023年01月16日 星期一

返回目录  放大缩小全文复制    上一篇  下一篇

南京图书馆历史文献部主任陈立详解——

古籍的数字化“旅程”

本报记者 姚雪青 《 人民日报 》( 2023年01月16日   第 11 版)

  浏览“江苏省珍贵古籍数字资源集成平台”,如同漫步在历史长卷中。《投笔集一卷》《憺园文集三十六卷》等文集有序排列在电子书架上,点开一看,古朴厚重的线装书一页一页、图文并茂地呈现在眼前。

  近日,南京图书馆“清人文集数据库”上线。作为“江苏省珍贵古籍全文影像数据库”项目第一期成果,该平台目前共收录清人文集400部,以全本彩色扫描的方式制作成13万余幅高像素数字图像,并带有检索功能,在全网发布。

  “南京图书馆馆藏的清刻本有7万多册,其中不少是清人文集。”南京图书馆历史文献部主任、江苏省古籍保护中心副主任陈立说,本次南京图书馆发布的数据库,便是结合馆藏优势,以图像数据库形式,集中公布了一批具有相同主题的珍贵文献。值得一提的是,这其中有许多“罕见”文献,甚至有些还是仅存“孤本”。陈立介绍,例如嘉庆时期刻本吴俊《荣性堂诗集》、潘奕隽《三松堂集》等,都是存世较少的清人文集。

  这些古籍是怎样从图书馆库房被“搬”到网络平台的呢?

  陈立介绍,古籍数字化过程分为两步。首先,要将古籍进行扫描。古籍扫描使用专用非接触式扫描仪,通过高像素照相机,尽量不按压古籍页面进行拍照;采用的光源是防紫外线的LED灯冷光源,图片颜色不能失真,要用色卡比对。

  扫描完成后,就要对这些原汁原味的图像做数据化处理,做至少深入到第二层级的标引,方便使用者按子目检阅相关内容。记者看到,每种文献的序和跋都进行了单独标引,通过检索可以单独搜索出来。“古籍的序和跋中不乏名家作品,具有较强的文学和研究价值,如《莫愁湖风雅集》中就有姚鼐作的序。”陈立介绍。

  平台的开发建设也至关重要。一方面,要完整、全面地给古籍“搬家”,还要方便、快捷地帮助使用者找到相应内容;另一方面,还要给后续发布的方志、家谱等多种类型的古籍文献“搬家”预留接口。

  古籍数字化的最大挑战,一是专业知识,二是技术。“从事这项工作,需要懂历史学、文献学、目录学等的复合型人才,还要有甘坐冷板凳的精神。”陈立坦言,南京图书馆对古籍文献进行扫描的工作从15年前就开始了,数字标引小组也在4年前启动。正因为有这些基础准备,“清人文集数据库”才能在近期与读者见面。

  不过,古籍数字化到这一步还没有结束。陈立介绍,古籍数字化的2.0版,将为古籍爱好者梳理浩如烟海的文字背后的知识逻辑顺序,制作专题知识图谱型数据库,甚至可将部分书中内容制作成“数字文创”,让曾经束之高阁的古籍更好走进千家万户。

版权声明

《人民日报》(电子版)的一切内容(包括但不限于文字、图片、PDF、图表、标志、标识、商标、版面设计、专栏目录与名称、内容分类标准以及为读者提供的任何信息)仅供人民网读者阅读、学习研究使用,未经人民网股份有限公司及/或相关权利人书面授权,任何单位及个人不得将《人民日报》(电子版)所登载、发布的内容用于商业性目的,包括但不限于转载、复制、发行、制作光盘、数据库、触摸展示等行为方式,或将之在非本站所属的服务器上作镜像。否则,人民网股份有限公司将采取包括但不限于网上公示、向有关部门举报、诉讼等一切合法手段,追究侵权者的法律责任。

人民日报手机报

移动用户 发送RMRB10658000

联通用户 发送RMRB10655111

  • ios版

  • android版

  • 微信小程序