期刊发表网电话

全国热线
022-83699069

数字信息长期保存策略探讨

作者: 发布时间:2020-02-04 14:17:17 阅读: 39 次

【摘要】随着信息技术和互联网的飞速发展,我国文献信息正全面进入数字化时代,各图书馆已经生产了大量数字资源,而与之相适应的保存数字资源的能力却远远落后,这已成为阻碍数字图书馆进一步健康发展的重大问题。本文针对数字信息长期存取过程中所遇到的问题和保存特点进行了分析,并从技术、法律以及管理等方面有针对性的提出了策略。

【关键字】数字信息资源  长期保存  归档系统

1. 数字信息长期保存内涵

1.1数字信息保存的含义

对于数字信息保存的概念,国内至今还没有形成统一的认识,其主要有以下几种代表性观点:种观点是“通过制定保存计划,进行合理的资源分配,采用必要的保存方法和技术,保证数字信息的持续检索和利用”;第二种观点从确保数字文献的使用寿命,包括长期可读性的角度,对数字信息保存进行界定。

关于数字信息长期保存的含义,主要有以下几个方面:(1)数字信息的可读性,即针对存储介质的保护;(2)数字信息的可用性,指数字信息能够被人或电脑阅读和处理;(3)数字信息的可理解性,是指数字信息的内容可以被他的使用者理解;(4)数字信息的完整性,是指数字信息是齐全的,并且未加改动;(5)数字信息的真实性,即文件与其用意相符。

1.2数字信息保存的特点

数字信息保存具有以下基本特征:(1)可读性,即可以检索,理解和使用等;(2)持久性,即保存时间的长久性;(3)真实性,即内容完整与可信。

2.数字资源在保存中面临的问题

2.1标准化问题

公共标准的缺乏是数字信息难以长期保存的根源之一。目前关于数字信息存在大量不同类型的格式,不同的格式为格式转换带来不便。因此,笔者建议使用一些标准格式。我国数字图书馆的焦点一直集中在数字图书馆建筑,信息组织与检索系统,信息展示与形象化,知识产权管理上却忽视了对数字信息保存的研究,这使得我国数字信息保存一直处于试行阶段,而且缺乏可被广泛接受的标准,这样就增加了数字信息在新旧平台间转换的难度,同时也使数字信息长期保存积累费用随之增高。

2.2技术问题

1.载体脆弱

数字资源的长期保存必须依附于各种类型的物理载体,常用的存储介质一般有软盘、磁带、CD—R0M、WORM 以及服务器。与传统的纸张相比,它们对存储环境的要求较高,受热、受潮以及空气的潮湿、污染以及强磁场的干扰都会使这些材料迅速退化,从而造成存储信息的衰减或丢失。

2.技术过时

数字资源对系统的软硬件平台是有依赖性的,这使得数字资源的读出和还原技术,成为困扰数字图书馆的又一大障碍。计算机硬件与软件技术迅速更新,必然会导致数字信息长期保存遭受技术过时的影响。因此,技术老化(technological obsolescence)被很多馆藏管理者看做是对数字存储的更大威胁。

3.存储能力弱

尽管计算机的存储能力不断提高以及价格的不断降低,却仍然无法赶上数据量的迅速增长。人们目前仍然面临处理和维护海量生成信息的存储的挑战。存储能力的有限与数字信息高速增长之问的矛盾要求数字资源的保存必须有选择性。

2.3法律问题

图书馆肩负着保存人类文化遗产的重任,并发挥着重要的作用。在多元化的信息网络时代,数字图书馆仍需要肩负保存人类文化遗产的责任,他仍然要充分利用各种信息技术来保存各种学术研究成果,保存人类的数字化文明成果。这一职能机构的作用应通过法律来确定,特别是信息专门立法中应包括确认数字图书馆对数字化资料进行管理和保存权利的条文,从而保证这部分资料成为图书馆的收藏。

1.知识产权问题

随着网络技术的发展,改变了原有信息的发布方式,模糊了出版与非出版之间的界限,也给数字资源的保存增加了难度。在出版物的纸质时代里,依照规定,凡是公开出版的书刊文献资料,出版者必须无偿向图书馆呈缴样本。由于数字化网络环境出版与否的界限不明确,少数著者或权利人宁愿不予正式出版而以许可权转让形式提供有偿服务,这样就使得一部分数字资源的保存遇到困难。对数字资源保存机构而言,是否有权将其捕获并加以保存成为更大的困难。

2.隐私权

数字资源的庞大必然导致由一些专门的机构承担专门领域或专门格式的数字资源保存职责,以及一些组织可能由于资金问题将数字文献的长期保存任务外包给其他专门机构,因此,第三方的介入都可能会牵涉隐私权的问题。

2.4存取安全问题

由于互联网是一个面向大众的开放系统,该系统对信息的保密和系统安全考虑的并不完备,因而安全问题日益突出,比如计算机病毒,黑客入侵等使得数字资源面临着前所未有的安全问题。同时,数字信息有共享和易于扩散等特点,它在处理、存储、传输和使用上十分的脆弱,很容易被干扰、滥用,遗漏和丢失,甚至被泄露、窃取、篡改、冒充和破坏,而且还时时有可能遭受计算机病毒的感染。这样,在长期的保存中保证数字信息的安全可靠是我们所面临的新课题。

3.实现数字信息资源长期存取的管理策略

3.1数字信息资源标准建设

在信息技术迅速发展的环境下,形成数据的格式和存取数据的软件也多样化。标准化成为数字信息生产与管理的非常紧迫的任务。数字信息在建立、接收、连接、利用和保存数字信息时应充分考虑建立相关标准。为此,在开展有关标准建设前,要分析目前数字信息存储标准进展情况,比较国内外的差异,明确研究的问题,构建基于用户的数字信息长期保存系统。我国数字信息长期保存标准制定、修订研究的主要目标包括:

从战略层面上,包括长期保存战略的规划、制定、实施、监察等,其中涉及数字信息长期保存的社会背景、实施原则、活动总目标及不同要求;

从管理层面上,包括谁负责数字信息的长期保存,他的职责范围及数字信息保存战略角色分配及责任体系构建,监测数字信息存储效果,评价数字信息保存风险:

从操作层面上,如何实施数字信息长期保存。

总之,在标准建设方面,需要总体规划,统一设计,集中攻克。

3.2制定相关法律,确保数字资源的长期存取

由于数字资源的保存存在知识产权方面的问题,所以,我们要在法律上建立一个有利于数字资源保存的保障体系,做到既有利于数字资源的保存,又有利于保障知识产权人的利益,使个体的、局部的利益、整体利益、长远利益与和暂时的利益之间保持平衡。

3.3建立数字信息资源的管理体系

随着数字化技术的进一步发展.数字信息的数量将会急剧增长,如上所述,数字信息资源的长期存取面临着许多问题,也需要相当的经费投入,依靠某个或某几个图书馆是无法承担如此重任的。因此,必须由有关职能部门负责,在全国范围内建立一个完整的数字信息保存的管理体系,通过制定电子出版物的法定送缴制度,确定电子出版物的送缴范围,来提高数字信息资源长期保存工作的水平与效率。

4.数字资源长期保存的策略分析

4.1 技术层次

在网络信息资源保存的技术策略上,各国都强调迁移和仿真是目前一种可行的和具有良好发展前景的重要方法。

1.数据迁移

迁移是指根据软件、硬件的发展持续的将数字资源从旧的软硬件环境转换到新的软硬件环境下,从而保证数字资源在新的环境中被识别,使用和检索,以进行数字信息的长期保存的一种技术手段。迁移可以分为硬件迁移、软件迁移、载体迁移、版本迁移、格式迁移以及访问点迁移等。经常采用的迁移方式有两种:将数字资源从定位低的媒体上迁移到稳定性更高的媒体上,从对软件依赖性强的格式迁移到对软件依赖程度低的格式上。迁移是在我国当前技术条件下数字信息所普遍采用的技术方法,他对于长期保存那些与软件无关的格式产生的文本文件较为实用。

2.仿真技术

技术仿真是用一个计算机系统去模拟另一个计算机系统的操作,使两者功能完全相同,他可以使一个计算机系统执行为另一个计算机系统编写的程序,而不必重新编写程序。仿真技术适用于超文本、多媒体等复杂的以及其他依赖特别软/硬件而又无法在新、旧技术平台之间进行迁移的数字信息。技术仿真是在实施数据更新保存数字信息内容的同时,通过保存数字信息利用环境(软件与硬件)来保障数字信息内容的可利用性。

3. 数字图形输入板技术

由于迁移必须不断对迁移时机进行选择,有时还会冒不断改变原文献的危险,为了克服迁移的某些不足,人们正在研制一种新的技术策略,即数字图形输入板(Digital tablet)。它是为了克服迁移技术存在的迁移时机不易把握、无法保存复杂数字信息的缺点而开发的一种新的技术。

数字写字板同时对需要保存的文件(档案)进行硬件和软件的保存。写字板是计算机图形设备中,拥有书写界面的输入设备,其中.写字板上定位和显示设备显示界面上的可定址点之间具有直接对应关系。该输入设备可将光笔位置产生的坐标数据数字化。作为一种数据信息长期保护手段的写字板,应具备如下特性:自带电源或以光为能源;自身备有屏幕并能将屏幕上的信息自动转化成数字信息进行存储。数字写字板的实体应该是异常的坚固、耐寒、耐高温、防水及抗重力等。

4.2元数据库层次

网络学术信息资源保存元数据标准受到重视。元数据方式是保存网络学术信息资源的重要和有效的方式,也是未来网络学术信息资源保存的重要发展方向。

数据库管理专家这样解释元数据:元数据是关于数据的一个信息库,这个信息库通过技术手段加整序,告之用户一则信息的最后更新时间,格式以及可用性。元数据指导用户如何使用数据库并协助用户理解诸如财务数据、客户档案以及事务处理等有关数据的意义及其上下文。由此可见,为了便于理解.完全可 把元数据看作是一种工具,用它人们可以在电子信息的海洋中查到所需要的信息。

元数据的功能:元数据这一词汇与数据库关系极为密切。元数据的目标是面向用户,即不关心数据库中存储的数据的技术结构,而提供给用户如何利用数据库类似“菜单”之类工具,帮助用户找到他们所需要的信息。一般来说企业的元数据库更重视用户需求方面。许多企业的元数据库的开发大多遵循以下考虑:

(1)将用户吸纳到开发工作中来,了解用户对不同数据所惯用的不同描述词汇,掌握用户利用数据的习惯方法以及用户的需求和所要解决的问题类型等。

(2)元数据文档要建立在标准的,结构化格式上,能够同时响应普通用户、核心用户以及通晓此技术的自家员工。

(3)寻求一种元数据产品使其包含技术元数据(即计算机专用词忙—— 数据诃典)和事务元数据。这样的元数据工具能够使元数据库支持各种各样数据维护和信息查询需求。

(4)使用户能够自行维护其元数据。

4.3 组织层次-建立全国统一数字信息归档系统

维护数字信息的长期存取是有一定的困难,这主要涉及到一些技术问题,包括格式、媒体的转换以及随技术更新对保存的数字信息进行技术迁移等问题。为有利于有价值信息的长期存取,并让用户相信所使用的数字信息是完整、真实的,必须建立数字信息归档系统,来保证数字信息的长期运行。这是数字信息长期保存的重要管理策略。这样.建立一个全国统一的数字信息归档系统,理应提到议事日程上来。建立在电子网络基础上的分布式电子归档系统能承担对某一数字信息的价值的更大了解,以便正确地决定选择;同时也能仔细地履行它们的归档责任,灵活地响应技术转变的时机,以促进数字信息长期存取和保护。

总之,随着信息化工程的大规模开展.大量数字化信息资源等待我们去管理,数字数据的保存是一项长期而有艰巨的任务。在数字资源的长期保存中所涉及的许多问题都将是传统文献管理中所没有涉及的,除了以上谈到的技术问题、法律规范问题外,还有保存策略问题、安全性问题等一系列问题。但不管怎样,我们应该看到,由于数字文献具有不同于传统文献的特点,因而信息只有在其产生的环境中加以保存才是最经济、最可行的,为了少走弯路,我们必须对数字资源的保存问题加以重视,进行深入研究,形成一个保护数字信息资源的社会氛围与技术环境。

参考文献:

1 吴振新,张智雄,郭家义.数字信息资源长期保存技术策略分析.现代图书情报技术,2006(4)

2 李克征.数字信息长期保存的技术方法分析.图书馆工作与研究,2006(2)

3 杜砚如.赵炜霞.数字信息长期保存技术问题探讨.情报杂志,2002(6)

4 董光彩.我国数字信息保存研究综述.现代情报,2006(9)

5 王少辉.美国数字信息长期保存实践.档案管理,2006(2)

6 朱志华.浅析数字资源的长期保存问题.湖北教育学院学报,2006(2)