在北京房山区一个极其普通的农家院落,年逾古稀的栾贵明带领一群风华正茂的年轻人,正在完成着一项极端枯燥而且空前艰巨的任务——建立《中国古典数字工程》。
在低矮简陋的平房工作间,卷帙浩繁的中国典籍与荧光闪烁的电脑屏幕交相辉映。16个春秋交替弹指而过,伴随着每天的日出日落和数次更换的主机键盘,一篇篇中国古典文献逐字逐句转化为可供研究者输入任意字词自由查找的海量电子数据。
栾贵明是我国著名文献学家、国家级有突出贡献专家,退休前为中国社会科学院文学所研究员。他早年毕业于北京大学中文系古典文献专业,1964年至2000年在中国社会科学院文学所工作,追随钱锺书先生从事学术研究35年。
1984年,在时任中国社科院副院长钱锺书先生的倡议和支持下,栾贵明先生创建了中国社会科学院文学所计算机室(1989年升格为中国社科院计算机室)并担任主任,从事中国古典文献数字化工作。经过短短数年,栾先生就和他的团队研制了容纳5万多个汉字的全汉字库,而且这个字库还具备繁体字生成功能。他们利用这个科研成果编纂了《论语数据库》《永乐大典索引》《全唐诗索引》。然而令人遗憾的是,1993年,因一场内部纠纷,栾先生无辜受挫,整整6年的心血和成果被没收,付之东流,已经数字化的古典文献均被毁坏,学术研究团队也遭解散。
沉寂数年后,2000年,栾先生申请办理了提前退休手续,与他在社科院的硕士生田奕等同仁招兵买马组建新团队,继续实施中国古典文献数字化工程。因经费拮据,几经辗转,才得以将团队落户房山农村。到目前为止,他们已经完成从太古时期到北宋之前的中国古典文献录入梳理工作,共计10亿多字。预计再过5年,可完成从三皇五帝到1911年中华民国成立前全部文字典籍的数据化,工程总计15亿字。
中国国家文物鉴定委员会副主任委员史树青先生曾经评价说:“中国文献博大精深,以前要找个资料,经常翻箱倒柜,非常不便。栾贵明完成了古典文献专著数字化后,就能够实现速检。”
一位从事语言学研究的学者说:“过去我们为了编字典,要考证一个字的由来和演变,需要找来很多很多的书,做大量卡片,通过积累以后才能得出一点见解。有了这样的数据库,通过计算机就能够很便捷地考证到某个字在不同历史阶段、不同古代典籍中的用法意义及其流变。”许多从事哲学、社会学、历史学研究的学者对此也深有同感。
栾先生说,为了完成恩师钱锺书先生的夙愿,他们一直在跟时间赛跑。利用拥有海量信息的“中国古典数字工程”,栾先生和他的团队还完成了《中国历史日历》《中国历史地图数据》《全唐文新编》《宋诗纪事补正》《永乐大典本水经注》《龙藏》《十三经索引》《千家诗选》,《扫叶丛书》中的《子曰》《炎帝集》《黄帝集》《老子集》《列子集》《庄子集》《孙子集》《鬼谷子集》《皇甫谧集》《李淳风集》《姚广孝集》等一大批科研成果。钱先生过世后,杨绛先生始终关心“中国古典数字工程”的进展情况,她还曾在田奕陪同下专程到驻地看望这个默默无闻、兢兢业业的工作团队,并为《宋诗纪事补正》题写了书名。
今年初夏的一个周末,天气闷热。我早晨从北京城里出发,遇上去郊外旅游的滚滚车流,到了房山区这个农家小院,已是中午时分。像往常一样,栾先生和他的团队成员们暂时放下手头的工作,走进简陋的食堂,每人一碗炸酱面配一杯绿豆汤就是全部午饭,我也有幸享受了这个“待遇”。
饭后畅叙,栾先生谈起他的研究成果和未来规划,这位背部已驼、满头银发的老者眼神中闪烁着孩子般乐观纯真的光芒。田奕女士坐在旁边,偶尔轻声插话。回忆起30年来艰辛努力、筚路蓝缕的往事,田女士语气平和,仿佛在叙述2000多年前的中国历史般理所当然,无怨无悔。