您的位置:首页 > 数字图书馆 > 政策法规

古籍数字化与共建共享

发布时间:2013-01-29 10:25:11     阅读次数:     选择字号:T|T

 

在全球网络化的今天,数字图书馆的作用日益彰显,公众根据自己的需求,可借助通信设备随时随地在没有围墙的图书馆检索和阅读各类型资料,这其中就包括古籍文献。古籍数字化资源是数字图书馆资源的重要组成内容。中华古代典籍是中华民族记忆的载体,是民族智慧和文明成果的结晶,是祖先留给我们的宝贵精神财富。图书馆肩负传承文明的历史重担,不但要保存保护好古籍,还要使其化身千百、服务社会。古籍数字化服务能够有效解决古籍保护和利用的矛盾,是传承文明、服务社会最重要的方式之一。
国务院办公厅颁布的《关于进一步加强古籍保护工作的意见》(国办发[2007]6号)中明确指出要制定古籍数字化标准,规范古籍数字化工作,建立古籍数字资源库。党的十七届六中全会提出,要“推进文化典籍资源数字化”。这是向图书馆古籍工作者提出的重要任务,是当前大力推进古籍数字化的有利契机。
一、古籍数字化实践成果
我国自上世纪80年代开始进行古籍数字化工作,经过几十年的探索与开发,取得了显著成果。在现存约15万个品种50万个古籍版本中,目前已完成大约3万个古籍品种的数字加工,超过20亿字的全文文本格式及数千万图像格式,并形成了较为成熟的古籍数字化技术和标准。
在书目数据库方面,拥有古籍馆藏的图书收藏机构大部分都建立了古籍书目数据库,同时运用信息系统技术建立了众多古籍联合目录数据库。在全文数据库方面,也涌现了大量古籍数字化成果,较有代表性的包括:国家图书馆古籍数字资源库,北京大学数字图书馆古文献资源库,上海图书馆馆藏善本古籍、家谱全文影像数据库,大学数字图书馆国际合作计划(CADAL),文渊阁《四库全书》电子版,中国基本古籍库等等。
国家图书馆是国内最早开展古籍数字化的图书馆之一,采用多种方式开展了古籍数字化工作,包括原件的数字化,缩微数字化,国际合作海外古籍文献数字化等。总计约3万余种。
国内大陆以外,港台地区以及汉文古籍收藏较多的英国、美国、日本等国在中文古籍数字化上都取得了一些颇有影响的成果。
二、古籍数字化建设面临的主要问题
我国的古籍数字化虽然取得了一定的成绩,但问题仍然凸显,还存在着一些问题有待解决,主要表现在:
(一)缺乏统一规划,重复建设严重
我国古籍数量庞大,且分散收藏各地。各收藏单位根据自身业务建设需要进行规划和开发馆藏数字化的工作。从全国古籍数字化工作来看,基本处于一种缺乏宏观管理和调控的状态。文渊阁《四库全书》至少已有三家进行过影像的数字化(上海人民出版社与迪志文化出版有限公司的光盘版,武汉大学出版社的光盘版,“中美百万册书数字图书馆”的网络版等),一家进行了影像全文文本的数字化(上海人民出版社与迪志文化出版有限公司的网络版)。二十五史数字版本就更多,造成了人力、财力、物力的浪费。
(二)缺乏统一标准,阻碍资源共享
就我国现已完成的古籍数字化成果来看,由于最初采取的往往是封闭式建设模式,各单位在著录格式、数据格式、文字编码等方面均存在差异。
在著录格式上,国家图书馆编写了《汉语文古籍机读目录格式使用手册》,并且按照MARC格式著录馆藏古籍, 有些图书馆采用的是都柏林核心元数据集DC数据格式进行古籍著录,还有不少图书馆是运用自己的方式著录古籍。著录格式的不统一,使得各馆编目数据的交换困难重重, 即使借助一定的软件依然需要很多的人工干预,非常不利于今后古籍资源的共建共享。
由于信息技术的快速发展和商业机构发展利益的需要,古籍数字化对象数据格式在选择上也面临繁多和复杂的局面,这其中有国际标准、事实标准,也有商业标准。
古籍著录大部分采用繁体字著录,但也有采用简体字著录的。由于选择字库不同,使得数据的交换无法直接进行,而只能通过专门的软件作为中介,进行格式和文字的统一。由于著录标准上的差异,今后即便能将这些数据汇入统一的数据库进行检索或跨库检索,也会给读者的使用带来诸多不便,导致无法真正实现国家乃至世界范围内的资源共享。
(三)缺乏经费支撑,区域发展不均
近年来包括国家图书馆、上海图书馆、北京大学图书馆、浙江大学CADAL管理中心等在内的古籍收藏机构已启动了一批古籍数字化工程项目,凭借资金、资源、人才上的优势,各自取得了十分显著的成果。但大多数图书馆由于经费匮乏、技术力量薄弱,古籍数字化工作仍然比较落后,一般还停留在图书扫描、部分普通书目数据库建设等简单数字化阶段,还有一些公共图书馆这方面的工作至今尚未启动。
(四)无统一发布平台,不利用户查询
由于古籍数字化成果没有统一的发布平台,各单位、各系统按照自己的规则发布,存在光盘版、网络版、局域网发布等多种方式,其中局域网发布又占了很大比例,因此虽然已有大量古籍数字化产品,但读者能够看到的却不多。从国家古籍保护中心对全国图书馆进行的调研中发现,古籍书目数据库大部分对外开放,而绝大部分图书馆的全文影像数字化产品只提供在馆阅览,不提供互联网服务,用户利用非常不便。
上述问题的存在,严重阻碍和制约了古籍数字化工作的深入开展。古籍数字化工作迫切需要统一规划,统一标准,合作共建,资源共享。
三、中华古籍数字资源库建设
中华古籍数字资源库是中华古籍保护计划的一个重要项目。在文化部领导下,国家古籍保护中心拟订了“中华古籍数字资源库建设方案”,计划第一阶段从入选《国家珍贵古籍名录》的古籍入手开展数字化工作,再以此为基础,进一步建立品种版本齐全的中华古籍数字资源库。
(一)整体规划
中华古籍数字资源库由全国古籍保护工作部际联席会议和文化部统筹规划,国家古籍保护中心和各省级古籍保护中心组织全国古籍收藏单位共同合作实施。按照统一标准开展古籍数字化工作,建立全面反映中华古籍品种和版本的中华古籍联合书目数据库和古籍影像资源库,包括汉文和少数民族古籍、甲骨文、简帛古籍、敦煌遗书、碑帖拓本、舆图等。
中华古籍数字资源库第一阶段的建设拟从《国家珍贵古籍名录》入手,计划在五年内完成一万种国家级珍贵古籍元数据和影像数据的建库工作。其次将范围扩大到善本古籍,最后扩展到普通古籍,用20年左右时间完成大约15万品种50万版本的古籍数字化。
为积累操作流程、使用标准、发布方式等各方面经验,拟选取基础条件较好、入选《名录》古籍较多的单位先行试点,为全面数字化打下基础,从小到大,逐步展开。
(二)中华古籍数字资源库的建设原则
1、统一规划。
由全国古籍保护工作部际联席会议单位和文化部统一领导,由国家古籍保护中心和各省级古籍保护中心负责组织实施。国家古籍保护中心负责整体规划及前期各项工作,调研古籍数字化进展情况,编制古籍数字化工作手册,拟定目录,培训人员,向省级古籍保护中心下达“中华古籍数字资源库”建设任务书。根据任务完成情况,组织专家和技术人员验收数字化成果,达到标准的正式发布,并支付相应费用;不达标的指导修改或重新制作,直至验收合格。
2.统一标准。
古籍数字化标准的先行建设是古籍数字化建设成果长期保存和最大限度共享利用的保障。古籍数字化标准规范体系建设要以实现古籍资源的共建共享为基本目的,优先采用已经成熟的国际标准和通用规范,认真贯彻国家标准和行业标准。建立全国统一标准,包括元数据著录标准、数字化影像标准、资源格式标准、资源标引标准、数字化古籍长期保存和发布标准等。
在多年的数字化实践中,陆续出台了一些相关标准。如《古籍著录规则》、《古籍描述元数据著录规则》、《汉语文机读目录格式使用手册》等等。目前大部分古籍数字化标准规范已经研发完成,可直接参照执行。国家古籍保护中心目前已组织人员编制“古籍数字化手册”,对即将开展的古籍数字化工作进行规范。
3.合作共建。
中华古籍数字资源库拟采用集中检索、分布建设管理模式。数据拟借助数字图书馆工程的平台发布,实现元数据和影像数据的集中检索和管理。
全国古籍收藏单位分工协作,按照国家古籍保护中心拟定的数字化目录和标准,在省级古籍保护中心领导下开展古籍数字化工作。
各省级古籍保护中心领导所属藏书单位开展古籍数字化工作,建成的数字影像资源存储在藏书单位的服务器上进行管理,同时建立统一接口,将古籍数字影像资源与中华古籍数字资源库元数据进行关联。古籍数字化应利用各藏书单位已经数字化并符合项目标准的成果,不搞重复建设,保证各自权益,从而实现中华古籍数字资源的合作共建。
4.资源共享。
古籍数字化成果的服务利用,要按照国家古籍保护中心制订的基本要求,一般为公益性免费向社会开放,提供读者检索、阅览、研究、利用。从事研究工作的读者在获得授权许可、签注保证书的前提下,可以下载影像数据。未经收藏馆授权,不得进行商业开发、出版、销售和数字发布。商业开发、出版、销售和数字发布,应与收藏单位另行签署协议。
(三)中华古籍数字资源库建设第一阶段任务
我国现存古籍数量庞大。“中华古籍数字资源库”第一阶段拟先从《国家珍贵古籍名录》入手,逐步实现我国所有古籍品种和版本的数字化。《国家珍贵古籍名录》是文化部组织评审、国务院公布的国家珍贵古籍目录,从《古籍定级标准》中规定的一、二级古籍中遴选产生。2007年至今,已评选出四批共11380部珍贵古籍,其中国务院已公布三批9859部,第四批上报国务院1521部待批准,其数量规模几乎是《中华再造善本》及续编1367种的10倍,是我国最珍贵的典籍文化遗产。对《国家珍贵古籍名录》中的珍贵古籍进行数字化,能更加全面的反映古籍的真实面貌,有利于学界对珍贵古籍的研究利用,是造福全民的大工程。国家古籍保护中心将协同各省级古籍保护中心,组织全国古籍收藏单位共同合作,将已入选《国家珍贵古籍名录》的古籍进行数字化。
1、摸清现状,拟定目录。
《国家珍贵古籍名录》入选古籍往往存在一种书入选若干相同版本的情况,进行数字化应精选最优版本。入选古籍的类别多种多样,包含甲骨、简帛、敦煌遗书、佛经、碑帖、汉文古籍和少数民族文字古籍,以及少量外文古籍。其中有些已经进行了数字化,有些暂时不宜实施数字化,需要区分轻重缓急,分批开展。因此,首先要调研现已完成的珍贵古籍数字化情况,组织专家拟定古籍数字化的阶段性目录。
2、数字化制作。
按照选定的古籍数字化目录,依据数字化相关标准,由古籍收藏单位进行数字化制作,包括拍照扫描前的整理、拍照扫描及标引工作等等。制作完成后由国家古籍保护中心组织验收,验收合格后上网发布。如某单位不具备数字化制作条件,可委托其上级主管单位代为制作和数据处理。省级古籍保护中心应充分发挥协调、管理作用,组织本省开展此项工作。

各位同仁,古籍数字化是古籍保存、整理和利用的必然趋势,也是数字图书馆建设的重要组成部分,目标是通过统筹规划,共同建设,使所有古籍数字化成果在最大范围提供服务利用,真正实现古籍资源的共建共享。让我们大家携手合作,共同努力,早日实现这一宏伟蓝图。