您的位置:首页 > 文化工程 > 数图推广工程 > 政策法规

数字图书馆建设与服务概述

发布时间:2013-01-29 10:16:50     阅读次数:     选择字号:T|T

一、数字图书馆概述

(一)数字图书馆的源起与发展

数字图书馆的概念是美国国家科学基金会(NSF)的伍尔夫(W.Wulf)在1988年撰写国际合作白皮书时正式提出的。美国最早开始数字图书馆理论研究和建设。1991年俄亥俄州政府投资建立州内图书馆网络中心,开始了数字图书馆的尝试。19949月,美国国家科学基金会(NSF)、国家宇航局(NASA)和国防部高级研究署(AKPA)联合发布《数字图书馆启动计划》(Digital Library Initiative),领导、组织和资助美国的数字图书馆研究和开发。继美国之后,英、法、德、日等国也先后提出各自的数字图书馆计划。

在我国,19965月,国家图书馆提出了中国试验型数字式图书馆项目,成为国家重点科技项目。1998720日,国家图书馆向文化部提出实施“中国数字图书馆工程”的立项,标志着中国数字图书馆工程进入实质性操作阶段。除了国家数字图书馆项目外,文化部、科技部、教育部等部委相继启动了一些工程项目,“中国高等教育文献保障系统(CALIS)”、“国家科技图书文献中心(简称NSTL)”、“全国文化信息资源共享工程”等是我国数字图书馆建设发展历程中的重要代表。

国内外近年来均投入了巨大的人力、物力进行数字图书馆建设,数字图书馆的概念、数字图书馆的建设模式、数字图书馆有关新技术等方面的研究都取得了不少成果。

(二)数字图书馆的定义

中国国家图书馆周和平馆长在国家数字图书馆十多年的建设与发展实践的基础上,提出“数字图书馆是网络环境和数字环境下图书馆新的发展形态,它利用现代信息技术,对海量、分布、异构的数字资源进行整合,形成有序的整体,通过各种媒体提供友好、高效的服务,使人们随时随地获取信息和知识。”

(三)数字图书馆的特征

数字图书馆特征主要表现在四个方面:信息资源数字化、信息资源传递网络化、信息资源利用共享化和信息资源提供知识化。

二、数字图书馆全业务流程

信息资源是图书馆开展服务的基础与前提,是图书馆赖以生存的必要条件。传统图书馆的业务流程可以概括为采编阅藏,数字图书馆的业务流程实际上也可以归纳为采编阅藏,只是贯穿数字图书馆业务流程的信息资源是数字资源,数字图书馆的建设与服务主要围绕数字资源的生命周期展开。

(一)采——数字资源的采集加工

1.数字图书馆资源建设概述

数字图书馆资源是指图书馆以数字形式发布、存取和利用的信息资源的总称。数字资源的生命周期是指数字信息资源从生产到消亡的自然运动过程,可以描述为数字资源的产生、数字资源的采集、数字资源的组织、数字资源的传播与利用以及数字资源的长期保存。数字图书馆资源建设是指对信息资源进行选择、采集、组织和管理,使之形成可利用的数字资源体系的过程。

2.数字图书馆资源建设形式

传统文献的采集主要通过接受缴送、购买、交换、受赠、征集、接受调拨、复制等方式采访文献。数字资源的采集途径也很多,主要包括采购、数字化加工、网络资源采集、网络资源导航、专题资源库建设、受缴、受赠和交换等,这些方式可以在数字资源建设工作中并存。

1)采购

主要是指商业数据库的采购,是指通过购买方式从本馆以外的权利人(包括团体和个人)处获得数据库资源的使用权或保存权。

2)自主建设

根据馆藏资源情况及服务对象的需求,有选择地分期、分批进行馆藏特色资源数字化和专题资源库建设。通常将图书馆建设的馆藏书目数据库、专题特色数据库和有效组织的网络资源统称为自建资源。自主建设数字资源还包括数字展览、在线讲座等原生数字资源。

在自主建设数字资源的各个环节必须严格遵守资源建设标准规范,这不仅有利于数字资源的用户发现和传递,提高其可用性,更能满足广域的资源共享和增值应用的需求。

3)网络资源采集

网络资源采集是指利用网络爬虫对指定的域名和网页进行自动采集,从而获得网络信息资源的过程。对于有能力进行网络资源采集的图书馆,应结合用户需求,确定采集策略、采集主题、采集范围等,进行有重点地采集。

4)合作建设

在平等互惠的原则下,图书馆与图书馆之间,图书馆与有关机构如档案馆、博物馆、科研机构、企业等之间,进行数字资源的共建与共享,包括资源交换、委托加工等。

此外,接受缴送和赠送也是信息资源的获取途径之一。

3.数字图书馆资源建设原则

我国各级图书馆开展数字资源建设已经二十余年,积累了大量的数字化产品、专题库,也形成了大量的商业数据库。总结国内图书馆开展数字资源建设的实践,我们认为数字图书馆资源建设应该重点考虑如下原则:

1)整体性与系统性原则

数字图书馆数字资源与传统载体资源共同构成了图书馆的馆藏文献信息资源,图书馆应注重对这两种资源的整合,构建多种载体、多种类型、分散异构的信息资源有机结合的、效能更好、效率更高的新的信息资源体系。同时应该注重资源建设内容的完整性和连续性,形成有重点、有层次、各类型资源比例适当的数字资源体系。

2)实用性和效益性原则

数字资源建设应该从图书馆的职能定位和用户的实际需求出发,最大限度地满足社会信息需求;同时根据各馆具体实际情况,统筹考虑采购方式、许可模式、许可期限、元数据、保存期限等诸多因素,达到效益最大化。

3)共建共享原则

在各级各类图书馆大量建设的今天,在遵守数字资源建设的效益性原则、保障性原则等方面的同时,应该考虑开展跨地域、跨系统的数字资源合作建设,建立优势互补、联合共享的数字资源保障体系。

(二)编——数字资源组织与整合

在数字资源急速增长的今天,图书馆需要对海量数字资源进行有效整合,方便用户使用。

1.数字资源描述体系

资源描述体系图书馆资源组织中最重要的部分,就目前我们身处的这个信息资源大爆炸的社会来说,我们缺少的不是资源,而是能更好地满足用户需求的资源。这就要求如何把数字资源更好组织与描述出来,能让读者最方便地查找到自己需求的信息资源。目前,图书馆最基本的资源描述体系包括以下3种。

1)以MARC格式为基础的编目体系。

就目前来说各馆对各种文献信息资源主要有两种最基本的MARC编目格式,西文文献资源主要使用MARC21格式,中文文献资源则使用CNMARC格式。

2)以Dublin Core为基础的元数据应用体系。

建立DC元数据的目的是建立一套描述网络电子文献的方法,以便于网络信息检索。DC元数据是由15个元素构成的、使用稳定的核心元数据集,可以描述大部分的资源。

3)以其他形式的元数据为辅的元数据应用体系。

随着数字资源的发展,元数据标准呈现多元化的发展趋势,除了DC元数据以外,国内外针对不同领域、不同资源、不同应用已有多种元数据规范存在。

2.数字资源整合

海量数字资源的大环境,读者需要更深层面、更细粒度、更小单元的资源揭示,更先进全面的信息查找、定位和获取目标信息的一站式服务,因此需要对数字资源进行整合揭示。

数字资源整合是综合运用各种技术、方法和手段对图书馆相互独立的各种数字资源进行系统化和优化,对各个相对独立关系进行融合、类聚和重组,重新结合为一个新的有机整体,形成一个效能更好、效率更高的新的数字资源体系。

目前,图书馆关于数字资源整合的模式主要有以下4种:

1)基于OPAC系统的数字资源整合

一般图书馆的书目数据库只是向读者展示了其印刷型的文献信息。如何改进OPAC系统,让读者能了解包括数字资源在内的全部馆藏,成为图书馆研究的一个焦点。现阶段多数图书馆的做法是对数字资源进行编目,将其MARC记录加入OPAC,把数字馆藏纳入到目录控制体系。

2)基于资源导航的数字资源整合

基于资源导航的整合也就是通过数字资源的URL建立数字资源导航系统,图书馆根据实际应用需求,搜集网上与某一专业或主题有关的信息进行筛选、提炼、分析、综合,组成专业信息资源组合。如:CALIS重点学科导航系统、中科院学科信息门户等都是将学科信息、学术资源等按学科门类集中在一起,实现资源的规范搜集、分类、组织和有序化整理,对导航信息进行多途径内容揭示,方便用户按学科查找相关信息和学术资源。

3)基于跨库检索的数字资源整合

图书馆自建数字资源和外购数据库往往有不同的检索入口,用户不能快速有效的找到所需资源。为了有效解决这个问题,图书馆需要建立统一检索平台,实现跨库检索,用户只需一次登陆,就可同时对多个数据库进行检索。

4)基于元数据的数字资源整合

元数据是关于数据的数据,或者说是描述数据的数据。提供了各种资源的特征和属性等相关信息,能较好地解决信息资源的描述、发现、定位与管理,基于元数据的数字资源整合是实现图书馆文献信息资源共建共享体系的关键,无论是在信息发现、信息检索和信息组织等各方面,元数据都起着十分重要的作用。

(三)阅——数字图书馆服务

1.数字图书馆服务概述

魏大威主编的《数字图书馆理论与实务》一书中,将数字图书馆服务归纳为:数字图书馆服务是现代图书馆服务的一部分,它利用新技术或网络的方式提供数字馆藏及相关数字资源的检索、发现、获取或推送、咨询、教育服务。

实际上,数字图书馆是一个平台,是一个渠道,是一种实现手段,数字图书馆的服务应该是传统图书馆服务的数字化、信息化和基于全媒体的创新,应该覆盖传统图书馆的所有服务对象和服务内容。从这个角度来说,数字图书馆的服务应该能够拓展图书馆服务渠道,使用户能够通过更加便捷的方式随时获得图书馆的资源;能够延伸图书馆服务范围,形成为立法决策机关、教育科研及企事业单位、社会公众、图书馆和信息机构服务的多层次格局;能够深化图书馆服务内容,实现数字资源的无缝传递和服务;能够提升图书馆服务质量,为社会公众提供现代化、个性化、多样化的服务。

2.数字图书馆服务内容

数字图书馆的服务应该根据服务对象、馆藏情况、基础设施建设情况,提供基于互联网、移动通信网、广播电视网等多种方式的服务,以便最大可能地满足用户的需求。

1)以深化服务内容为核心的信息化服务

深化图书馆服务内容的重点是方便读者获取资源、获取信息,应该提供一站式的元数据、目录数据、馆藏数据、专题数据库等资源检索服务;通过多种方式提供线上的资源获取服务,在版权允许的情况下提供全文下载服务。通过互联网提供馆际互借与文献传递的服务。

2)以提升服务质量为核心的智能化服务

数字图书馆应该通过新技术、新理念,为到馆读者提供自助借还服务、自助办证服务、自助复制、智能架位、触摸屏电子报、电子阅览室等优质服务,为非到馆读者提供实名用户认证、虚拟参考咨询、在线展览、在线讲座、在线学习等便捷服务。

3)以拓展服务渠道为核心的新媒体服务

随着信息化深入发展,移动互联网、广播电视网已经成为新的信息通道,手机、平板电脑、数字电视等新媒体终端已经成为人们获取信息的重要媒介。数字图书馆需要在互联网基础上进一步拓展渠道,提供新媒体服务。主要包括移动数字图书馆服务和数字电视服务。

4)以延伸服务范围为核心的多层次服务

数字图书馆的服务应对社会普遍开放,数字图书馆服务应该是多层次的。对立法决策机关,应该提供政府公开信息、法律信息等各种知识化资源库,提供互联互通的立法决策服务平台、智能参考咨询系统等服务;对科研单位和企事业单位应该提供专业化的虚拟参考咨询系统、舆情检测与分析系统等服务;对残疾人则应该提供无障碍信息获取服务;对于少年儿童则应提供符合少年儿童需求的数字资源与服务。

5)以合作共建共享为核心的网络化服务

数字图书馆的服务是一个服务网络。图书馆仅是信息社会的服务供应者之一,面对共同的信息用户,图书馆必须开展业界合作和跨界联合,开展联合编目、联合目录、联合馆藏、联合咨询等,协同作业,才能形成整个社会的服务网络。

3.数字图书馆服务策略

目前各馆在提供数字图书馆服务的过程中,呈现出一些不足之处,主要包括服务平台没有统一规划,读者使用困难;服务理念缺乏创新,缺乏前瞻性研究;从事数字图书馆服务的图书馆员经验欠缺等。我们认为数字图书馆在服务设计、提供中应重点考虑如下策略:

1)整体性策略

要统筹规划图书馆的各项服务,通过统一的用户界面和接口提供全面服务,充分发挥数字图书馆的优势,突破地域和时间限制,最大限度地方便服务对象。

2)创新性策略

开展前瞻性的研究,推动数字图书馆的服务创新,通过技术创新,发展和开拓丰富多样的服务。

(四)藏——数字资源保存

1.数字图书馆资源保存

信息化时代,数字资源实际已经成为国家的战略资源、数字资产。在很多情况下,数字资源比物理资源更加脆弱,更容易被毁坏,或者他们的载体更容易被淘汰,因此数字资源的保存尤为重要。

数字资源保存的目标是维持数字资源长期的可生存能力、可呈现能力和可理解能力。数字资源的存储介质主要包括磁盘、硬盘、光盘和磁带。

2.数字资源的保存策略

数字资源总量庞大,需要海量的存储介质,保存成本较高;数字资源建设目的不同,决定了数字资源保存的策略也应该不同。因此需要制定数字资源的保存策略。

1)数字资源保存级别

根据数字资源保存和利用的不同特点,一般把数字资源划分为三类保存级别,即长期保存级、不定期保存级和临时保存级,以分别满足数字资源当前与长期利用的需要。根据保存级别制定相应的保存策略。

2)长期保存级数字资源保存策略

长期保存的数字资源主要包括馆藏所有元数据(书目数据、规范数据、分类主题数据、馆藏数据)、馆藏数字化的特色资源数据库、重要的中文网络资源,授权永久保存的中文资源数据库,以及国外重要的工具性数据库。长期保存级的数据以光盘或者磁带为保存介质,并同时保存至少三份作为备份。对异地和离线保存的数字资源,定期对于磁带和光盘进行检查、复制、转换等日常管理维护工作。

3)不定期保存级数字资源保存策略

对于一时无法确认是否需要永久保存的数字资源,以及在当时有保存价值但经过一定时期后可能就会逐渐丧失保存价值的数字资源,为不定期保存级。不定期保存的数字资源主要包括网络发布的所有数字资源。不定期保存级的数据需一至两份作为备份;届时根据相关标准转为长期保存级的,需按长期保存级的要求备份。

4)临时保存级数字资源保存策略

当在线服务的数字资源出现异常丢失或损坏时,确保其能够立即恢复与提供服务的数字资源,为临时保存级。临时保存资源一般包括发布与服务的数字资源,资源供应商提供镜像的数字资源,以及带有对象数据链接的元数据资源等。对于在线资源,一般可考虑三个层次的存储策略,一是数字资源发布与服务系统的存储,二是本地的数字资源存储管理中心的存储,三是异地灾备数字资源存储。

(五)数字图书馆的支撑

数字图书馆建设与服务的支撑系统包括标准规范、软硬件技术平台和政策制度体系。

1.标准规范

数字图书馆是在网络环境下建立的数字资源采集、加工、描述、管理、服务和保存的系统,其最终目的是要实现数字资源的广泛存取与最大化共享。标准规范作为数字图书馆建设的基础,是开发利用与共建共享资源的基本保障,是保证数字图书馆的资源和服务在整个数字信息环境中可利用、可互操作和可持续发展的基础。

数字资源建设是数字图书馆的核心内容,基于数字资源生命周期的数字资源建设标准体系目前已被许多数字图书馆项目所应用,该标准体系主要包括数字内容创建、数字对象描述、数字资源组织管理、数字资源服务、数字资源长期保存几大方面的标准规范。

2.技术支撑

建立数字图书馆工程是一项庞大的工程,在建设数字图书馆过程中要认真思考,重点解决数字图书馆的关键技术和技术体系结构问题,尤其是技术体系结构中的各应用系统的实现。同样要注意数字图书馆建设中的任何一个细节问题,只有这样才能建成一个现代化的、方便快捷的数字图书馆。

数字图书馆涉及到诸如:文献数字化技术、网络技术、数据挖掘、搜索引擎技术、VPN技术、Raid技术、用户接口设计等许多新的、较复杂的技术。

三、数字图书馆推广工程

发挥数字图书馆的最大效益,应该以开放、融合、创新的理念,连接全国各级各类数字图书馆,实现信息的双向互通和资源的共建共享,构建覆盖全国的数字图书馆服务体系,形成基于新媒体的图书馆服务新业态。数字图书馆推广工程将承担这一重要任务。

(一)数字图书馆推广工程的建设内容

将推广国家数字图书馆工程的理念、技术、标准,搭建覆盖全国公共图书馆的数字图书馆虚拟网,建设分级分布式数字资源库群,借助手机、数字电视、移动电视等新兴媒体,以互联网、移动通信网、广电网为通道,为政府立法决策、教育科研、公民终身学习等提供多层次、多样化、专业化、个性化的数字图书馆服务,打造基于新媒体的图书馆服务新业态。

(二)数字图书馆推广工程的总体架构

数字图书馆推广工程的总体框架主要包括基础设施、分布式库群、业务支撑和运行支撑、服务应用、统一认证、以及配套的保障体系。

基础设施主要由网络通信系统、存储、计算机服务器等组成,它是连接数字图书馆虚拟网的必备条件,也是实现全国各级数字图书馆实现互联互通的基础和前提。

分布式库群是依托各级图书馆的丰富馆藏和数字资源建设成果,建设的分级、分布、海量公共文化资源库群,它是实现数字资源共建共享的资源基础,将丰富面向各类用户不同需求的信息资源内容。

运行支撑则通过建立数据登记、运行管理、任务管理、虚拟网管理等系统,实现各级数字图书馆之间的资源访问权限管理、数据互访、交换、共享和集成等功能。

业务支撑是指在数字资源生命周期全过程管理理念下的数字资源建设、组织、保存等核心业务系统。将这些核心业务系统的在各级图书馆分布式部署使用,形成全国范围内分级分布的资源建设、加工、存储调度体系。

服务应用将实现资源之间无缝互连,建立贴近用户习惯的统一检索系统,并通过知识组织技术,建立知识之间的关联,从而形成知识网络,并全面整合图书馆的参考咨询、馆际互借、文献传递、联合目录等资源,使其在数字图书馆推广工程的服务系统中充分发挥作用。

配套的保障体系主要包括标准规范体系、评价体系以及培训机制。通过定义数据标准、技术标准、各种运行机制,保证各级数字图书馆数据共建共享的一致性、规范性和互操作性。

四、结语

数字图书馆建设是一个系统性的工程,即使对传统图书馆的融合、扩展,也是创新。数字图书馆建设与服务所涉及的内容、技术都是在不断发展的,公众及业界对数字图书馆的认识也是不断深化的。数字图书馆建设应该是开放性的、创新性的。数字图书馆推广工程将以开放、融合、创新的理念构建覆盖全国、互联互通、共建共享的数字图书馆服务体系,形成基于新媒体的图书馆服务新业态。

本文试图从数字图书业务全流程的角度揭示数字图书馆建设与服务的基本情况,无法完整涵盖和深入展示数字图书馆建设与服务的全部内容,不当之处敬请批评指正。