数字资源的合作共建与共享推广
发布时间:2013-01-29 10:20:37 来源: 阅读次数: 选择字号:T|T
“数字图书馆推广工程”(以下简称推广工程)是继文化共享工程、公共电子阅览室计划实施之后,文化部、财政部在“十二五”时期启动的又一项重大文化惠民工程,对全国公共图书馆事业发展起到了积极的推动作用。自2011年5月工程正式启动以来,在党中央、国务院和文化部领导的高度重视下,在各地政府和图书馆的大力支持与共同努力下,推广工程取得了一系列的建设成果和良好的社会反响。
数字资源建设是数字图书馆建设的核心,也是各项服务的基础,在推广工程的建设与实施过程中,数字资源建设与共享起着至关重要的作用。随着各地硬件配置工作的陆续完成和各软件系统平台的相继复用,数字资源建设将成为推广工程工作的重中之重。从2012年开始,推广工程将逐年加大数字资源建设力度,借助已搭建的虚拟网平台,将国家数字图书馆和各地数字图书馆的资源建设成果更多更快更好地服务于公共文化建设,同时加强资源的共建和整合揭示,整体提升我国数字图书馆服务水平,加快实现全国数字资源建设成果的全民共享。
一、“数字图书馆推广工程”资源建设目标
推广工程将在全国建立若干资源建设中心、资源保存中心和资源调度中心,构建分级分布式公共文化资源库群,在全国范围内形成有效的数字资源保障体系。到“十二五”末,数字资源总量达到10000TB(超过世界上主要发达国家的国家图书馆馆藏文献总量之和,相当于26亿册图书,或926万小时视频),其中电子图书达到200万种,电子期刊12000种,电子报纸2000种,音频资源20万小时/100万首曲目,视频资源30万小时/150万部集,网络信息资源1000TB。使每个省级数字图书馆拥有资源100TB,每个市级数字图书馆拥有资源30TB,每个县级数字图书馆拥有资源4TB。
在推广工程总体建设思想的指导下,结合全国各地数字图书馆资源建设和主要需求,2012年度推广工程将分阶段、有计划开展资源建设工作,逐步实现全国数字资源的共知、共建和共享:全面启动全国自建数字资源登记工作,年内完成不少于20万个资源条目的登记工作;启动推广工程专题资源库的建设,初步形成类型丰富、分级分布的推广工程数字资源揭示与服务体系;广泛开展国家数字图书馆已建设数字资源的共享和推广(首批可共享资源约130TB)。
二、我国公共图书馆数字资源建设现状
我国自二十世纪九十年代开始进行数字图书馆研发,经过十余年的发展,国家图书馆和省市级公共图书馆在数字资源建设方面都取得了丰硕成果,积累了宝贵的建设经验,为推广工程的资源共建共享打下了坚实基础。
(一)国家数字图书馆资源建设成果
1998年,国家图书馆开始跟踪国外数字图书馆的研发进展,以馆藏资源数字化加工为突破口,开始了大规模的数字资源加工工作。2001年,“国家数字图书馆工程”正式立项,十年来累计投入数字资源建设相关经费逾2.4亿。同时,国家图书馆在数字资源共建共享方面也一直积极探索,进行了许多有益尝试,广泛与国内外图书馆开展数字资源合作,如哈佛燕京图书馆古籍数字化合作项目、世界数字图书馆项目、中日韩数字图书馆合作项目、中华寻根网项目等,通过多种渠道不断丰富馆藏数字资源内容和数量。2010年,国家图书馆面向全国各省级公共图书馆广泛开展数字资源征集工作。目前,国家图书馆数字资源征集项目征集的全国各地数字资源存储量已达8.8TB,包括地方志、民国文献、老照片、家谱、专题视频和馆藏特色资源等多种类型的数字资源。
截至2011年底,国家数字图书馆数字资源保有量已达561.3TB,其中馆藏特色数字资源总量达458TB。资源类型包括文本、图像、音频、视频、网络资源等多种形式,涵盖范围包括古今中外各个历史时期,内容丰富,种类齐全,其中超过76%的资源已发布服务。
(二)省市级数字图书馆资源建设成果
2010年底,国家图书馆对全国41家副省级以上公共图书馆的数字图书馆建设情况进行了大规模调研。数据显示:在数字资源建方面,41家图书馆全部都购入了商业数据库,各馆共采购数据库651个,总容量达677TB,其中省级图书馆外购数据库462个,容量为473.73TB,市级图书馆外购数据库189个,容量为203.51TB;有39家图书馆建设了具有本地特色的数字资源库,占调研总数的95%,各馆自建数据库总数量达540个,总容量达244TB,其中省级图书馆自建数据库348个,容量为174.77TB,市级图书馆自建数据库192个,容量为68.99TB。
各地的数字资源内容丰富,形式多样。自建资源具有鲜明地域特色,外购资源保障了区域内用户的一般文献信息需求。数字资源服务深受读者欢迎,图书馆的知名度与影响力不断扩大。
(三)我国公共图书馆数字资源建设中存在的一些问题
我国公共图书馆的数字资源建设在快速发展的同时,也遇到了一些不容忽视的问题。尽管数字资源总量庞大,但仍存在缺乏合作、标准不统一、无法实现数据共享等现象。
1 数字资源“孤岛化”存在,缺乏合作和规模效应
目前,许多省馆、市馆都拥有了一大批颇具地域特色的专题数据库,但这些具有鲜明区域特色的资源更多是服务于本地用户,在互联网上无异于一个个信息孤岛,无法形成集群效应。如果能够建立一个大规模的资源平台,将这些地区的特色资源集成在一起,形成代表中华民族文化特色的资源集群,必然能为全国乃至全球更广泛的用户提供优秀中华文化资源服务。
2 各省市建设标准各异,成为全行业整合的系统障碍
目前,由于我国各省市图书馆的数字资源建设缺乏统一标准,许多图书馆拟定了自己的数字资源建设标准,各馆所建的数字资源不仅在数据库结构上不兼容,在用户检索界面、检索语言等方面也存在很大的差异。全国图书馆急需适合国情的数字资源建设的标准和规范,使数字图书馆的资源建设走上规范化发展轨道。
3 全国缺乏统一的整合平台,难以真正实现资源共享
目前,各省(市)数字图书馆的建设规划、系统平台都是自治的,异构的,数据存放于本地的数据库、文本文件、XML文件中,这给资源共享带来了阻碍。全国图书馆界急需一种机制使各省数字图书馆系统能有机地结合为一个整体,解决应用系统间的数据交换和互通互用问题。因此,有必要在全国建立一个通用的、元数据集中、资源分布存储的数据集成交换平台,并在此基础上实行分工协作,互尽义务,互利互惠,才能真正实现资源共享,使全国读者享受到普遍均等的数字资源服务。
三、推广工程背景下数字资源的共知、共建与共享
为了避免重复建设,发挥资源的整体优势与规模效益,在全国范围内共享各地优秀数字资源建设成果,有必要在中央层面建立一套高效的数字资源共知、共建、共享机制,使数字资源建设的效率最优化,从根本上提升我国图书馆的数字资源建设能力和服务水平。推广工程资源建设正是顺应了这一思路,以下将从建设原则、思路和2012年的建设工作进行具体介绍。
(一)建设原则
统筹规划,分步实施。数字图书馆推广工程资源建设在推广工程总体思想的指导下统筹规划,结合全国各地图书馆的发展现状,分阶段、有计划的实施。
立足需求,锐意创新。用户需求是推广工程资源建设的基础和出发点,资源建设过程中要充分考虑到广大人民群众的各种需求;同时,资源建设过程中也要对各地图书馆的需求进行综合把握,包括历史文化、经济水平、数字图书馆建设现状、用户特点等,从而使所建设的资源更贴近真实需求。
优势互补、共建共享。在推广工程资源建设过程中,应该集各馆智慧与资源以形成行业合力,实现各级数字图书馆的优势互补,共建共享,全面提升各级图书馆的数字资源存量和服务能力。
服务社会、惠及全民。资源服务方式多样化,除传统的资源镜像、远程访问等方式以外,应积极探索基于VPN网络、手机、数字电视、网络电视、触摸屏等多种媒体手段的资源推广,使资源能够通过更灵活、更便捷和更广泛的途径为用户获取,提升推广工程在公共文化服务体系的辐射面和影响力,使得数字图书馆建设成果可以真正惠及全民。
(二)建设思路
资源共知。加快实现全国公共图书馆的资源共知,通过全国自建数字资源登记项目,有效揭示离散分布的自建数字资源,并与图书馆商购资源进行集成整合。同时与国家书目系统形成互联,实现对纸本馆藏和数字馆藏的集成揭示,最终建立贴近用户习惯的资源统一检索系统,实现对全国公共图书馆馆藏资源的统一揭示和有效管理。
此外,在对全国图书馆数字资源集成揭示的基础上,推广工程还将不断优化元数据与对象数据的合理关联,通过知识组织技术,建立资源内容单元之间的知识关联,并逐步形成知识网络,针对不同群体的需求提供个性化多样化的信息与知识服务。
资源共建。以“合作共建”和“合理共享”为原则,全国图书馆合作共建特色资源库。有重点的建设一批类型丰富、特色鲜明的优秀数字资源,遵循统一的加工标准与规范,实现资源之间的无缝跨库互连,建成一个内容丰富、类型多样、体系完整、组织有序的分布式公共文化资源库群,最终构建全方位、多层次的国家级数字资源保障体系。
此外,工程将采用远程访问、区域授权等方式加大普适性商业数字资源的购买力度,积极探索商购资源联合谈判等共建方式,不断拓宽各地图书馆的资源获取渠道。
资源共享。发挥资源的整体优势与规模效益,探索在全国范围内形成数字资源共享机制。推广工程建设前期,结合推广地区的政治、经济、社会、文化等因素,将国家图书馆的数字资源建设成果和普适性的商业数字资源在推广工程范围内进行共享,为地方提供多元化、特色化、定制化的数字资源,提升各地数字资源馆藏保有量,并以VPN访问、统一认证、镜像等不同形式实现各馆对资源的获取,提升各地图书馆的数字资源服务能力。
随着推广工程的深入,我们还将逐步探索建立资源多层多向共享机制,全面整合图书馆的参考咨询、馆际互借、文献传递、联合目录等系统,实现对全国数字资源的深度开发与整合利用,形成国家、省、市三级公共图书馆数字资源的多向传输和交互共享,最终实现我国公共图书馆数字资源的全面共享。
(三)2012年资源建设工作
1 全国公共图书馆自建数字资源登记
为加快实现全国公共图书馆的资源共知,推广工程在2012年正式启动全国公共图书馆自建数字资源元数据登记项目。在全国公共图书馆范围开展自建数字资源登记,有效揭示离散分布的数字资源,对全国公共图书馆的数字资源进行有效整合与揭示。
项目意义。自建数字资源登记项目是推广工程资源建设的基础性工作,是统计、建设、利用自建数字资源的重要一环,目的是全面了解全国公共图书馆自建数字资源的现状,汇总形成元数据仓储,为数字资源的统一检索、整合、评估和开发等深度建设提供元数据基础。同时,统一揭示、分布服务也为各馆自建资源增加了新的展示途径。
项目规划。项目预期对我国省级、副省级及主要市级公共图书馆(预计有400家)的自建资源进行普查、登记。预期用3年时间对已建资源进行登记,2012年为项目的启动年,主要目标是对元数据登记项目的宣传普及,并和部分公共图书馆开展试点合作,为日后项目的全面开展打下基础。预计2012年收集整理的数据不少于20万条。2013和2014年为项目主要实施年,力争到2014年底能完成400家公共图书馆自建资源的登记。从2015开始,项目将进入维护和续建阶段。
工作内容。数字资源登记的对象为各图书馆自建的数字资源,类型包括但不限于数据库、图书、期刊、论文、报纸、图像、音频、视频数据等。项目前期主要登记可以独立使用的自建数据库、图书、音视频、图像等四种类型的资源。登记项目分为资源申报、资源遴选、协议签署、元数据提交、元数据验收、元数据发布等环节,具体内容详见附件1《2012年全国公共图书馆自建数字资源登记办法》。
当前进展。年初,项目制定了资源登记实施方案,并明确了自建数据库、图书、音视频、图像等四种类型资源的登记规范,完成了和各图书馆的协议文本,针对数据库类型制作了页面提交表单,各馆可以直接在网页上进行登记,其他类型资源的元数据将以文件的形式上传。5月,国家图书馆已向2011、2012年所有实施推广工程的图书馆(共计218个)下发了关于2012年全国公共图书馆自建数字资源登记的函。目前,各项工作正在稳步推进中。
2 数字图书馆推广工程数字资源联合建设
国家图书馆将与地方图书馆合作,共同建设数字资源。根据推广工程资源建设目标,以“合作共建”和“合理共享”为原则,合作共建特色资源库,通过数字化、拍摄、转制加工等方式,有重点的建设一批类型丰富、特色鲜明的优秀数字资源。
建设意义。资源联建将集全国公共图书馆之力,发挥地区优势、体现地域特色、提高数字资源的规模效益和整体优势,合作共建特色资源库。建设成果通过工程平台在全国范围内进行推广,联建资源将和各地已建设数字资源成果互为补充,联合保障区域内的文献信息需求,最终构建全方位、分层分布的国家级数字资源保障体系。
建设标准。推广工程的资源建设须遵循国家数字图书馆工程对各类型数字资源的标准规范,以建设符合统一数据质量标准的资源,并确保这些资源具有分散对象数据和统一元数据集的构架,能够有效整合为各类型数据库,实现资源之间的无缝跨库互连,形成规范且灵活易用的公共文化资源库群。
联建主题。重点建设包括能够展现中华文明、弘扬先进文化、体现时代发展的优秀数字资源,服务覆盖政府立法决策、学术科研、终身教育、少年儿童等广泛受众。拟建设主题包括中华文明资源、立法决策服务资源、学术研究基础资源、社会文化知识资源、多彩民族文化资源、少年儿童优秀资源、特殊群体服务资源等。希望各地图书馆能够积极参与此项工作。
管理办法。数字资源联建工作由国家图书馆进行整体规划和实施,并负责经费管理、项目评审和成果验收。项目建设的资源成果属于数字图书馆推广工程所有,用于全国推广和服务。为确保项目顺利实施,对参与资源联建的单位给予经费支持。资源联建将采用项目申报的方式,各地方公共图书馆可根据技术能力和本馆特色申请主导或参与某一类型资源建设。项目工作组组织相关专家对申报项目进行论证,经专家论证后,确定入选参建机构,开展资源建设工作。
工作安排。推广工程资源联建工作将于2012年下半年启动,按计划完成项目申报和评审工作,2013年根据评审结果启动资源联建工作。地方馆可以先行开展项目筹备工作,为顺利通过项目评审争取更多的时间。近期,推广工程将邀请资源建设方面的专家,召开资源联建项目专家研讨会,商讨本年度联建工作的建设主题。
3 2012年“数字图书馆推广工程”共享资源配置方案
依据推广工程资源建设目标,我们制订了2012年“数字图书馆推广工程”共享资源配置方案,拟按此方案开展面向各地的资源共享和配置工作。共享资源依据版权清晰、馆藏互补的原则,把国家数字图书馆的建设成果和部分优秀商业数据库在推广工程范围内进行共享。
资源内容。此次共享资源包括10万册中文图书、13000种图片、2700种视频、15个商购数据库,总容量超过128TB,内容详见附件2。中文图书资源包括自建和商购两部分,其中自建图书的共享需要与各馆的纸质馆藏进行匹配,从而提供相应的电子图书,商购图书采用全国并发访问方式进行共享;图片资源主要是反映中华悠久历史和地域特色的老照片资源;视频资源包括讲座、戏曲、动漫、专题资料片等,共计3000余小时;商购数据库资源共计15个,包括5个中文数据和10个外文数据库,以全国授权或买断式的普适性商购数据库为主,涵盖图书、期刊、报纸等各类型数据库,内容详见附件3。部分外文数据库资源需要使用馆按年度支付一定的平台使用费(附件3中加*部分),各馆可根据实际需要自行选择。
共享方式。此次资源共享主要通过VPN、互联网、本地镜像等方式。中文图书资源和数据库资源需要通过馆域网向读者提供服务,其他共享资源可以通过互联网向读者提供服务。随着推广工程资源建设的不断推进,工程将开展分层共享服务。针对开放版权资源,将通过推广工程网站提供互联网服务;针对有限版权资源,可借助推广工程虚拟网、统一认证、远程镜像等方式向各地图书馆提供局域网服务;针对版权限制和需要保密的资源由参建单位自行选择发布方式。
四、结语
数字资源建设是数字图书馆建设的核心,也是推广工程的重要工作内容,希望各地图书馆能够全力支持推广工程资源建设工作,通力合作,共建共享,加快形成海量公共文化资源库群,全面提升我国数字图书馆整体服务水平,实现数字图书馆建设成果的全民共享。
附件 1 2012年全国公共图书馆自建数字资源登记办法
一、登记目的
全国公共图书馆自建数字资源元数据登记项目是数字图书馆推广工程资源建设的基础性工作,是统计、建设、利用自建数字资源的重要一环,其目标是实现对全国公共图书馆自建数字馆藏资源的清查与整理。通过对全国公共图书馆自建数字资源的清点,全面了解和掌握全国公共图书馆自建数字资源的现状,有利于从整体上规划数字图书馆推广工程的资源建设,实现规模效应,避免重复浪费。同时,通过对各图书馆元数据的汇总形成元数据仓储,便于各馆自建资源的发现与使用。
二、登记对象
数字资源登记的对象为各图书馆自建的数字资源,类型包括但不限于数据库、图书、期刊、论文、报纸、图像、音频、视频数据等,登记注册粒度包括但不限于种、册、期、篇、幅、首、场等,前期主要登记可以独立使用的自建数据库、图书、音视频、图像四种类型的资源。
三、登记原则
1、登记全国公共图书馆所有自建数字资源的元数据,前期主要登记可以独立使用的自建数据库、图书、音视频、图像四种类型的资源。
2、登记资源包括各馆已建设完成的和在建的符合登记要求的资源,拟建资源可后续登记。
3、所登记的数字资源,国家图书馆与登记馆可同时为用户提供服务。
四、登记流程
1、资源申报
意向馆依据《全国公共图书馆自建数字资源登记办法》(2012)、《全国公共图书馆自建数字资源登记元数据规范》(2012)及数据库、图书、音视频、图像的专门元数据规范,填写并提交《全国公共图书馆自建数字资源登记申报书》(2012)原件和电子版各一份,同时提交一定数量的样本元数据。
1)申报书原件寄送地址:
北京市中关村南大街33号国家图书馆数字资源部
邮编:100081
收件人:李荣艳
收件人联系电话:010-88545579-803
2)申报书电子版上传地址:ftp://202.106.125.34
用户名与密码请邮件索取。Email:liry@nlc.gov.cn
2、资源遴选
国家图书馆数字资源部对提交的申报书进行汇总和初审,而后报馆方批准确定拟登记资源。
3、协议签署
国家图书馆与登记馆就数字资源登记事项进行商务与法务的协商,并签署《全国公共图书馆自建数字资源登记协议》,经费直接支付给登记馆。
4、元数据提交
登记馆根据《全国公共图书馆自建数字资源登记元数据规范》及双方签署的协议所规定的时间、内容、标准等要求,以硬盘、光盘、FTP上传等形式提交登记元数据和说明。
5、元数据验收
国家图书馆根据《全国公共图书馆自建数字资源登记办法》及双方签署的协议,对提交元数据的内容、数量、质量等进行全面验收。
6、元数据发布
国家图书馆将把整合后的元数据灌入文津搜索系统和数字资源发布系统中进行统一发布,为读者提供服务。
附件 2 2012年“数字图书馆推广工程”共享资源
配置方案
类型
|
种数
|
资源说明
|
中文图书资源
|
100000
|
本馆有纸质馆藏的数字化资源。
|
图片资源
|
13000
|
反映中华特色的老照片资源。
|
视频资源
|
2700
|
包括讲座、戏曲、动漫、各种专题片等共计3000余小时。
|
数据库
资源
|
15
|
包含5个中文数据库、10个外文数据库。涵盖图书、期刊、报纸、档案、数值事实、教育课件等资源。详见后表。
|
资源容量合计:
|
约128TB(外文库服务器不在本地,未算在资源总量中)
|
注:外购资源中如与图书馆原有资源重复,不再配置。
附件3 数据库资源一览表
数据库名称
|
数据库类型
|
内容单元数量
|
简介
|
|
日出东方--马克思主义中国化90年大型电子图书展
|
图书
|
1万余册
|
以人民出版社1921年以来出版的著作文献为主,共展出图书1万余册,对90年来我们党重要的思想理论图书资源进行了揭示,记录和反映了马克思主义中国化两次飞跃的历史性进程和理论成果。
|
|
2
|
国家统计数据库
|
数值
事实
|
—
|
包括全国和地区改革开放以来经济社会等方面的主要统计数据及2000年以来世界主要国家和地区经济社会等方面的主要统计数据。
|
3
|
中国/世界进口商名录数据库
|
经济
事实
|
55万家
|
内容包括200个国家及地区的55万家进口商的基本数据。
|
4
|
专利检索与服务系统
|
专利
事实
|
—
|
收集了97个国家、地区和组织的专利数据,并可进行专利分析。
|
5
|
学大小状元
|
教育
课件
|
76450个课件
|
主要内容包含小学语文、英语、数学、音乐、美术课堂学习课件和故事数学、童话故事等课外学习课件76450个。
|
6
|
Emerald回溯期刊数据库
|
全文
|
178种
|
该数据库内容包含 178种全文期刊,超过11万篇的全文内容,涉及商业管理、信息科学、材料学及工程学等领域,年代自1898至2000年。
|
*7
|
SAGE回溯期刊数据库
|
期刊
全文
|
380种
|
该数据库内容包括380多种期刊,共计3.2万多期、460多万页的41.8万篇全文,年代从创刊起至1998年。
|
*8
|
Eighteen Century Collections Online(十八世纪文献在线)
|
全文
|
18.8万种
|
该数据库收录了18世纪英国、美国等其他语言国家的著作。涵盖历史、地理、法律、文学、语言、参考书、社会科学及艺术、医学等领域。除了包含18世纪著名的作品还包含当代著名的评论它的书籍。原始资料来源于大英图书馆、牛津大学、哈佛大学、剑桥大学、苏格兰国图书馆、爱尔兰国家图书馆、美国国会图书馆。
|
9
|
The Making of Modern World,MOMW(现代经济之路)
|
全文
|
6.1万种
|
该数据库收录了Goldsmiths'-Kress经济文学图书馆1450-1850年间经济与商业类出版物61000种图书,全文超过一千二百万页。涵盖了商业、金融、社会环境、政治、贸易和运输等领域。
|
10
|
The Making of Modern Law,MOML(现代法律之路)
|
全文
|
2.2万种
|
该数据库包含了自1800年后在英国及美国出版的所有法律类图书共2万2千种,超过一千零六十万页。此数据库共包含99个法律领域,涉及了英、美法律体系的所有方面。
|
*11
|
Early English Books Online(早期英文书籍在线)
|
图书
全文
|
12.5万余册
|
该数据库收录了所有现存的1473-1700年之间英语世界出版物的资料。收录著作12万5千多本共2250万页电子图像。
|
*12
|
EAI美国早期印刷品
|
电子
图书
|
7.4万种
|
该数据库是《美国历史文档(Archive of Americans)的子数据库之一,与EEBO、ECCO为三大历史电子图书。收录了1639-1839年间在美国出版的图书出版物7.4万种,包括:图书、年鉴、小说、剧本、诗歌、圣经、教科书、契约证书、法规、地图、乐谱、布道书、演讲词、条约、旅行记录与印刷报告等。
|
*13
|
珍稀原始典藏档案合集:亚洲(Archives Unbound Asia)
|
档案
全文
|
-
|
包括10个主题:亚美事件,中国和战后反共热;中国内战和中美关系:美国国务院侨务办公室记录;新教徒传教士团中国记录;全球传教团和神学团体;处于战争和和平时代的日本:美国国务院保密文件的记录;日美搬迁营报纸:日常生活透视;整顿上海公共租界;美中贸易全国委员会记录;抗议美国:抗战的越南退伍军人;来自国家安全委员会越南信息小的情报报告。
|
*14
|
Declassified Documents Reference System (解密档案参考系统)
|
全文
|
10万余份
|
该数据库是研究二战后美国内政及国际关系的重要资源,涵盖了10万多份文档,超过59.5万多页的资料。
|
*15
|
Digital National Security Archive(解密后的数字化美国国家安全档案)
|
档案
全文
|
8万余份
|
DNSA收录了大量珍贵的从1945年开始的美国对其他国家外交、军事政策的第一手资料,它是目前该领域内收录信息最全面的数据库总页数达60多万页。
|
注:加*数据库需使用馆按年度支付一定的平台使用费。