您的位置:首页 > 文化工程 > 数图推广工程 > 政策法规

数字图书馆推广工程标准规范体系建设规划与实践

发布时间:2013-01-29 10:18:02     阅读次数:     选择字号:T|T

 

标准规范是现代图书馆发展的一个重要基础,是实现全行业协调协作的基本保障。随着计算机和互联网技术在图书馆领域的广泛应用,以及跨地区、跨系统图书馆合作的普遍开展,标准规范的重要性也越来越凸显。以往的工作实践中,MARC格式对资源共建共享的推动,Z39.50协议对异构数据库统一检索的支持,已经让图书馆界自标准规范中受益。数字图书馆标准规范体系建设是保证数字图书馆的资源和服务在整个数字信息环境中可利用、可互操作和可持续发展的重要保障,是促进数字图书馆推广工程快速、经济和可持续发展的重要条件。
一、数字图书馆标准规范体系建设的意义
数字图书馆推广工程是一个复杂的系统工程,其内容包括软硬件平台建设、数字资源建设和数字资源服务等多个方面。在工程建设之初就制定和遵循统一的标准规范,对于确保工程建立的资源和服务具有广泛的可使用性、互操作性和可持续性,具有重要意义。
(一)分布异构资源的共知、共享需要标准规范
推广工程将建设海量数字资源,从来源上看,这些资源主要来自于外购数据库、各馆自建特色资源、网络资源的采集与保存等;从格式上看,包括全文文本、全文图像、音频、视频、书目数据等;从类型上看,涉及电子图书、电子期刊、电子报纸、学位论文、网络资源、讲座、展览、古籍、书画等。这些资源或者来自于不同的数据库商,或者是由不同的图书馆分别加工而成,分布存储在各级数字图书馆系统中,如果在工作过程中不依据统一的标准规范,就会造成大量数字资源不能被其它系统所收割、检索和使用。因此,必须建立数字资源建设过程中的一整套标准规范体系,对各类型资源进行统一揭示、描述、加工、组织、管理和保存,才能实现在推广工程的统一平台上对这些海量的分布异构资源的共知和共享。
(二)分布式系统平台的整合、交互需要标准规范
推广工程的建设主体是全国各级公共图书馆,以后还有可能扩展至其他系统的图书馆。根据工程的总体技术框架设计,工程将要搭建的系统平台也将是分布式的。各馆围绕本馆的业务特色和服务需求,已经建设并将继续建设一批自己的个性化平台,这些平台一方面需要工程统一平台的资源保障和服务支持,另一方面也需要向平台提供可以共享或可供统一平台调用的资源与服务,从而实现与推广工程统一平台之间的无缝连接和跨库交互。而这一切的基础都是彼此遵循统一的标准规范,特别是各馆的个性化平台与总平台之间的数据交换和互操作规范。
(三)分布式用户服务的普惠、均等需要标准规范
推广工程是“十二五”时期一项重要的文化惠民工程,其最终目标是要为社会公众提供随时随地、方便快捷的数字图书馆服务。要实现这一目标,就要充分依托现代信息技术,尽可能弥补传统图书馆服务中的地域差别、城乡差别和时空限制。例如,工程将依托各种新媒体技术手段,向用户提供基于数字电视、手机、智能移动终端等的数字图书馆服务。对于图书馆来说,这些都是新的服务领域,一方面需要建立针对不同媒体的资源标准,使得符合标准的资源能够在特定媒体上为用户提供服务;另一方面也需要建立与这些媒体运营商管理平台之间进行数据交互的标准规范。
正因为数字图书馆标准规范体系所具有的特殊重要意义,在任何一个数字图书馆系统建设中,都需要遵循标准规范先行的原则,而且标准规范的建设也将始终贯穿于数字图书馆建设过程中。
二、 数字图书馆标准规范体系建设现状
随着数字信息资源和网络信息服务的不断发展和丰富,在不同系统之间进行数字资源与服务共享的需求日益强烈,从而使数字图书馆标准规范建设在世界范围内引起了广泛的关注,国内外一些主要的文献信息机构、数字图书馆建设项目和标准化组织都对数字图书馆领域的标准规范进行了广泛地研究和实践,数字图书馆相关标准规范的涵盖范围从数字资源加工与描述标准,逐渐扩展到数字资源生命周期全过程的标准;标准规范的研制主体逐渐从单个数字图书馆扩展到各类型数字图书馆合作系统。我国数字图书馆标准规范建设虽然相对稍晚于英美等国家,但是在积极吸收借鉴国际数字图书馆建设领域有关标准规范建设成果和经验的基础上,也已经取得了突破性的进展。这些建设成果为数字图书馆推广工程的标准规范建设奠定了良好的基础。
(一)国外数字图书馆标准规范建设状况
1 主要数字图书馆建设项目
国际上一些主要数字图书馆建设项目中都建立了一系列的标准规范或指南性文件,以指导和规范数字资源建设与服务。美国国会图书馆、数字图书馆联盟(DLF)、美国博物馆及图书馆服务协会(IMLS)、联机计算机图书馆中心(OCLC)、加州数字图书馆等机构在数字图书馆建设方面均发布了系列标准或指南。
以美国国会图书馆为例,其发布采用或负责维护的标准规范涉及资源描述、元数据封装、资源保存、信息资源检索协议等多个方面,包括MARC21、MARC XML、MODS、MADS、EAD、METS、MIX、PREMIS、Z39.50、SRU/SRW、CQL等。在美国记忆(American Memory)项目中,对元数据(Metadata)、保存(Preservation)、扫描和转换(Scanning and Conversion)、文本标记(Text Mark-Up)等各方面进行了详细的规范。英国的电子图书馆计划发布了eLib标准指南(eLib Standards Guidelines),在该指南中对应用服务、数据交换、元数据、安全认证和支付服务等方面进行了规范;加拿大文化在线项目发布了其技术要求及推荐指南等;另外,澳大利亚、新西兰、日本等国家在数字图书馆建设中也建立了一系列标准规范文件。
2 主要标准化组织
一些国际性标准化组织近年来在数字图书馆标准规范方面也有了很大进展。例如,ISO、NISO、W3C均已发布了一批与数字图书馆建设密切相关的标准,并被广泛应用于数字图书馆建设中,成为数字图书馆建设的主流标准。
l 国际标准化组织(ISO)
国际标准化组织的ISO标准体系中已有不少标准广泛应用于数字图书馆建设中。例如在元数据方面主要有ISO 15836信息和文献 都柏林核心元数据元素集(DC)等;在长期保存方面有ISO 14721空间数据和信息传递系统——开放档案信息系统——参考模型(OAIS)等。
l 美国国家信息标准化委员会(NISO)
美国国家信息标准化委员会(NISO)近年来也发布了一批与数字图书馆建设密切相关的标准,主要有Z39.50检索协议及Z39.89(Z39.50协议在图书馆的应用)、Z39.84(DOI语法)、Z39.85(DC元数据)、Z39.87(静态数字图片技术元数据数据字典)、Z39.88(OpenURL)、Z39.93(SUSHI协议)等。
l 万维网联盟(W3C)
万维网联盟(W3C)推荐的标准在数字图书馆建设中发挥了重要的作用,例如可扩展置标语言XML(eXtensible Markup Language)、资源描述框架RDF(Resource Description Framework)、Web本体语言OWL(Web Ontology Language)等。
目前,在国际上已经初步形成了相对完善的数字图书馆标准规范体系,以及联合开放的标准规范建设机制和应用机制,为我国数字图书馆标准规范建设过程中充分借鉴国外成熟与开放标准、采取先进机制、加快建设步伐,提供了很好的条件。
(二)我国数字图书馆标准规范建设状况
我国图书馆界在数字图书馆建设过程中一直比较重视标准规范的建设与发展,在研究国外相关标准规范的基础上,依托特定项目、特定单位制订了一系列数字图书馆标准规范。其中影响较大、较有代表性的有:
1 我国数字图书馆标准规范建设(CDLS)项目
“我国数字图书馆标准规范建设(CDLS)”项目于2002 年10 月启动,是近年来非常有影响的标准规范研究项目,由中国科技信息研究所、中国科学院文献情报中心和国家图书馆联合发起,近20个单位参与项目的研发和建设,发布了百余份技术报告,2006年开始项目二期的建设。CDLS项目不仅包括数字资源加工、元数据、唯一标识符等数字图书馆有关标准规范的研究与制定,而且对我国数字图书馆标准规范的发展战略、建设机制进行了研究分析。
2 中国高等教育文献保障系统(CALIS) 数字图书馆建设标准和规范
CALIS 管理中心从2002 年开始进行数字图书馆方面的国际标准和关键技术的研究, 2004 年10月正式发布了《中国高等教育数字图书馆技术标准与规范》(简称《CADLIS 技术标准与规范》,包括了3个方面的内容:一是CADLIS 总体架构和基本技术标准与规范;二是各个子项目专用的技术标准与规范;三是有关产品认证和项目管理方面的内容。后又不断进行修订完善,形成了一系列资源、服务与技术等方面的标准规范。目前,该系列规范已经广泛应用于CALIS项目建设中。
3 国家数字图书馆工程
国家数字图书馆工程自2005年开始建设以来,始终坚持“标准先行”的原则,将标准规范体系建设作为工程建设的一项重要内容予以规划,根据建设需要,先后制定了二十余项数字图书馆标准规范,内容涵盖数字资源的组织、加工、描述、服务、保存等多个环节,这些标准规范将成为数字图书馆推广工程标准规范建设的基础。与其它系统标准规范成果相比,国家数字图书馆工程的标准规范成果具有实用性、可操作性和指导性较强的特点,每一项标准规范均紧密结合国家图书馆的业务实际,制订了该标准规范的应用指南,详细说明了该标准如何在业务流程中使用。2011年,为指导公共图书馆系统数字图书馆建设,全国图书馆标准化技术委员会从中选择了17项较为成熟的标准规范,向文化部申报立项为文化部行业标准制修订项目。
4 其他
“中英文图书数字化国际合作计划(CADAL)”项目,形成了一套数字资源建设方面的技术规范,对元数据、资源加工、资源发布、资源传递等进行了规范。
上海图书馆是国内开展元数据,特别是都柏林核心元数据(DC)研究较早的图书馆,并在此基础上制订了名人手稿元数据。
此外,党校数字图书馆系统、军队数字图书馆系统也正在国家数字图书馆标准规范体系的基础上,结合本系统实际情况,建立自己的标准规范体系。全国文化信息资源共享工程也颁布了与国家数字图书馆核心标准基本一致的标准规范。
三、 建设数字图书馆推广工程标准规范体系
为实施好数字图书馆推广工程,要继续坚持标准先行的原则。基本思路是在国家数字图书馆已经形成的标准规范基础上,借鉴各级各类图书馆已有成熟标准规范成果,结合推广工程的实际需要,建立较为完善的数字图书馆推广工程标准规范体系,研制一批适用的标准规范,并指导各地制订相应的标准应用指南,以实际指导数字图书馆推广工程的资源建设、资源服务及软硬件平台搭建,保证数字图书馆推广工程建设的标准化、规范化。在此基础上,争取形成一批数字图书馆相关国家标准和行业标准,为推进全国数字图书馆建设的标准化和规范化进程做出贡献。
(一)建设原则
数字图书馆推广工程标准规范建设的原则主要有:
(1)标准规范先行原则。应该遵循标准规范先行的原则,让标准规范引导、约束工程的建设。
(2)成熟标准优先原则。应优先选择已有成熟应用的国际标准、国家标准,或已被广泛接受的行业标准、事实标准,同时充分借鉴国内已有的数字图书馆标准规范研究与实践成果。
(3)联合、开放、公开原则。充分依托全国图书馆标准化技术委员会等国内相关的标准化组织,广泛联合具有标准制定和实施经验的文献信息机构、研究机构和企业等。项目研制成果应通过公开质询、专家论证等方式,广泛征求国内各文献信息机构及专家的意见。
(4)核心建设原则。以数字资源建设与服务为核心,围绕数字资源生命周期规划数字图书馆的标准化工作,特点解决中文信息处理方面的有关标准。有关网络、通信等软硬件基础支撑环境的标准则主要采用相关行业的通行标准。
(5)注重应用原则。标准规范要能够实际指导数字图书馆推广工程的建设,并切实应用在各馆的数字资源建设与服务中,要特别注重各类标准应用指南的研制开发。
(6)大馆建设中小馆应用原则。在推广工程建设过程中,国家图书馆、各省级、副省级图书馆等大型图书馆要承担起标准规范发展战略、标准规范体系框架、标准规范制定、标准规范开放建设与应用机制建立的职责。中小型图书馆要积极应用工程推荐的标准规范来指导本馆的数字图书馆建设,并就标准规范的修订给出建议。有能力的中小型图书馆,也可以根据自身情况适当参与到一些标准规范的开发与建设中。
(二)体系框架与建设内容
数字图书馆推广工程的标准规范体系,围绕数字资源生命周期为主线进行构建,主要包含数字内容创建、数字对象描述、数字资源组织管理、数字资源服务、数字资源长期保存五个环节。
基于数字资源生命周期的数字图书馆标准规范体系框架图
数字内容创建方面的标准规范主要用于数字资源内容创建过程,包括内容编码、对象标识、数据格式等内容。推广工程目前已推出了汉字处理、唯一标识符、对象数据等多项标准规范。汉字处理规范主要是针对图书馆文献类型复杂,汉字字符数量大的特点,尤其解决了古籍文献数字化中面临的集外字处理、全文文本版式还原等问题。唯一标识符规范是为实现对数字资源的统一管理与调度,相当于为每一个数字对象赋予“身份证”信息,便于各类型、各层次数字资源的有效调用。对象数据规范主要是在各类型数字对象(包括文本、图像、音频、视频等类型)的创建与加工过程中需要遵循的标准规范。
数字对象描述方面的标准规范主要指数字资源描述元数据的相关规范。元数据是关于数据的数据,图书馆针对传统文献的MARC格式即是一种元数据规范。随着数字图书馆的发展,传统的文献描述与揭示方式已不能满足数字资源的需要,专门针对网络资源、数字资源特点的都柏林核心元数据(DC)应运而生,并逐渐得到广泛应用,已成为国际标准和我国国家标准。推广工程针对描述元数据已建立了一系列元数据应用规范。
数字资源组织管理方面的标准规范是专门针对数字图书馆建设中面临的组织与管理问题而建立的规范体系,包括知识组织、版权管理、数字对象管理等问题。
数字资源服务方面的标准规范是指数字图书馆在网络服务、检索服务、应用服务等方面应遵循或建立的标准规范。目前,推广工程在数字电视、移动设备等新媒体服务方面开展了很多工作,针对此方面的标准规范也亟待建设。
数字资源长期保存方面的标准规范涉及保存策略、保存元数据、资源封装等。数字资源长期保存是数字图书馆建设中面临的重要问题,鉴于数字资源的海量性、复杂性,要实现数字资源的长期保存与可持续利用,必须要有一套规范体系的支撑。
(三)已有标准规范
在国家数字图书馆工程已经完成的标准规范基础上,去年,我们根据数字图书馆推广工程的实际需求,经文化部批准,首批申请立项了17项数字图书馆领域的文化行业标准。由几十个公共图书馆、高校图书馆、科研院所图书馆共同组成17个标准编写组,结合数字图书馆推广工程建设的需要,对国家数字图书馆工程相关标准规范成果进行了修订,并广泛听取了业界专家意见。这些标准将陆续作为行业标准出台,供推广工程建设使用。国家数字图书馆工程已有标准成果和标准应用指南也可以供各馆建设数字图书馆时参考采用。
数字图书馆推广工程已有标准规范成果一览表
数字资源生命周期环节
标准名称
数字内容创建
图书馆数字资源唯一标识符规范
文本数据加工规范
图像数据加工规范
音频数据加工规范
视频数据加工规范
数字对象描述
古籍元数据规范
电子图书元数据规范
电子连续性资源元数据规范
学位论文元数据规范
期刊论文元数据规范
网络资源元数据规范
音频元数据规范
视频元数据规范
图像元数据规范
数字资源组织管理
图书馆数字资源统计规范
图书馆管理元数据规范
数字资源长期保存
图书馆数字资源长期保存元数据规范
(四)重点核心内容
针对推广工程的建设重点,以下重点介绍唯一标识符、元数据管理和对象数据管理的相关标准规范。
1 唯一标识符规范
唯一标识符是实现实体(也称为对象)标识的完整体系,相当于数字对象的“身份证”,是实现数字资源有效调用与管理的基础。推广工程在对国际上比较通行的数字对象唯一标识符(DOI)规范等进行了充分调研的基础上,结合我国数字图书馆建设的需要,研制了“图书馆数字资源唯一标识符”(LDOI)。该规范系统规定了LDOI的体系架构,实际指导并规范数字图书馆唯一标示符系统的建立与应用。
2 元数据管理规范
简单地说,元数据是关于数据的数据。图书馆目前所应用的元数据主要是以针对传统印本文献的CNMARC或MARC21格式为主。鉴于数字资源的特点,目前的资源描述与组织规范已不能满足对数字资源揭示与组织的需要,推广工程已研制了一整套元数据规范体系,实际指导并规范数字资源元数据的建设。
推广工程元数据规范体系包括核心元数据、专门元数据、管理元数据、保存元数据等。其中核心元数据是适用于各类型数字资源描述、管理、保存的核心元素集,是以DC元数据为基础建立;在此基础上,根据确定的扩展规则,建立针对各种不同类型资源的专门元数据,目前对10余个图书馆比较有代表性的资源类型建立了专门元数据;管理元数据是从数字资源生命周期管理的角度,构建了数据模型和数据词典,包括资源采集、加工、服务等管理流程中涉及的各种元数据;保存元数据是用于支持数字资源长期保存及长期可获取的元数据,推广工程依据国际图书馆界通行的PREMIS保存元数据,制定了推广工程的保存元数据规范。
3 对象数据管理规范
对象数据管理规范主要用于各类型资源的数字化加工与管理。推广工程的数字对象包括文本、图像、音频、视频及复合数字对象等多种格式。数字对象的创建与加工是数字资源建设的基础环节,目前关于各种类型数字对象的格式标准非常多,分别适用于不同的资源类型和不同的应用级别。为规范数字图书馆资源建设,结合图书馆数字资源的情况,推广工程已制定了数字资源对象管理规范,以及文本、图像、音频、视频数据加工标准与工作规范,详细规定了各类型数据采用的格式,根据发布服务、长期保存的不同需要,制订了相应的应用级别标准,并规范了各类数据的加工流程。
四、下一步工作设想
随着数字图书馆推广工程的不断发展,未来在标准规范建设方面还有大量工作要做。
(一)进一步完善工程标准规范体系
目前工程已经制订完成的标准规范还主要集中在元数据和对象数据管理领域,还需要根据工程建设要求,按照“技术标准为支撑、管理标准为指导、服务标准为应用”的原则,进一步完善标准规范体系,特别是建设平台接口规范、数据交换与互操作规范、新媒体服务类规范与管理类规范,最终形成能够支撑数字图书馆系统建设需要的系列标准规范。我们希望有能力的图书馆共同参与标准规范的研究与制修订工作。
已有标准规范也需要在工程实际建设过程中不断修订与完善。希望各馆在应用过程中将发现的问题或者进一步改进的意见及时反馈给我们。
对于那些经过数字图书馆建设实践检验已经比较成熟的标准,我们将依托全国图书馆标准化技术委员会等行业标准化组织,将其上升为文化行业标准或国家标准,使其为我国数字图书馆建设提供标准支持。
(二)针对重点领域加快标准规范的制修订
在已有的基于数字资源生命周期的标准规范体系框架下,国家数字图书馆工程已经制定了20余项标准规范,这些标准规范可以较好地复用到数字图书馆推广工程中来。但是,随着推广工程的深入开展,新的服务业态逐步形成,对标准规范也将产生新的需求,比如随着图书馆的资源类型进一步丰富,可能需要新建与书画、戏剧、曲艺、实体文物、交互资源、软件作品等新型资源相关的元数据规范;随着服务范围的延伸,可能还需要新建与移动服务、数字电视服务、残障人士无障碍服务相关的数字图书馆服务标准等。我们希望工程的标准规范建设采取开放建设的机制,也就是说希望各馆首先应用工程已有标准规范成果,如果不能满足需要,可以提出新的标准规范制订需求,并由若干个有一定研究能力和实践基础的图书馆共同制订。
(三)推进已有标准规范成果的推广与应用
数字图书馆推广工程一直强调“标准先行”,目的是为了能够促进标准规范建设成果在工程建设中的实际应用。加强已有标准规范成果的宣传与应用,是推广工程标准规范建设工作的重要内容之一。作为推广工程的组织协调单位,国家图书馆将积极组织标准应用培训,结合资源建设、平台搭建等讲解相关标准的具体应用。希望各馆积极应用工程已有标准,并结合本馆的实际情况,制定标准应用指南,使工程标准能够切实指导各馆数字图书馆建设实践。