快生活 - 生活常识大全

浅谈图书管理数字化的基本原则


  随着现代通讯技术、计算机技术的迅猛发展,学校图书管理的现代化发展水平越来越高。图书管理员如果仅有一点专业知识,不能及时更新知识结构,掌握新的信息与技术,就不能胜任当今知识经济时代的图书管理工作。知识信息时代对图管员新的要求是;既要具有一定的思想政治素质、较高的职业道德修养,有热爱图书事业的爱岗敬业之心,有积极进取的开拓创新勇气,有强烈的责任感、使命感和踏踏实实的工作作风;又要有科学文化素养:要掌握广博的科学文化知识,除图书管理专业知识外,还要懂得管理学、教育学、心理学、计算机科学等知识,具备复合型人才合理的知识结构,以适应图书馆的各项工作。同时要有较高的业务素质,懂得图书管理学的基本理论,掌握一定的现代化技术,能够胜任文献资源的收集、组织、加工、传播和网络服务,为读者提供相关的咨询服务等业务工作。
  以上是图管员的自身素质,笔者认为个人素质是干好工作的关键,如果想干好某项工作,首先就要热爱它、喜欢它,只有这样才能把这件事情干好。
  当今社会,由于计算机技术、数字存储技术、现代通讯技术和网络技术的飞速发展及有机结合,信息存贮和检索的地理界限已经被打破,人们能通过计算机网络查询分布于世界各地的数据、图表、文献等信息。图书馆作为信息资源的收集、整理、存贮和交流中心,要改变以往的工作模式,确保在任何空间、任何时间,准确、快捷地为所有用户提供所需信息。由于各图书馆资金有限,不得不对已有的数字化内容进行选择。图书馆信息资源数字化内容选择是依据确定的标准进行相符性判断,将符合条件的原始资源遴选出来,继而进行数字化加工的一个过程。科学的选择原则有助于确保以尽可能低的成本将最重要、最有用的信息资源进行数字化,避免知识产权纠纷,产生良好的社会效益和尽可能高的投资回报。
  一、进行数字化内容选择的原因
  1、存储空间的原因
  数字化的产品是通过网络被广大用户所存取利用,而众所周知数字化产品是存放在磁盘阵列上的,磁盘阵列由服务器来管理,磁盘空间是有限的,服务器的能力也是有限的,不可能无限量地存入数字资源,这就需要对文献资源数字化内容进行选择。
  2、内容选择
  数字化生产高成本和图书储藏经费有限性之间的矛盾,几乎没有图书储藏仓库有充足的资源来对整个馆藏进行数字化,内容选择也不可避免。
  3、数字资源管理的需要
  技术的快速发展使数字化项目所生成资源的生命周期越来越短,投入巨资进行数字迁移是延长数字资源生命的一个重要途径,昂贵的维护成本决定必须考虑数字化的内容选择。
  4、特殊文献的考虑
  图书馆大都收藏一些对文化伦理乃至民族问题敏感的信息资源,对这些资源进行数字化必然要考虑很多因素。
  5、残缺文献处理成本的考虑
  图书馆的馆藏文献中有一部分是残缺不全的,对这些文献进行数字化之前要进行补缺或作相应的说明,其费用比较昂贵。
  6、图书馆信誉的需要
  图书馆作为责任机构,要为其数字化且公开发布的信息资源的可靠性和准确性负责。
  二、高校图书管理数字化内容选择应遵循的基本原则
  不同的数字化项目其内容选择原则不尽相同,综合来看,高校在数字化内容选择的时候都要遵循以下七个原则:
  1、原始文献知识价值原则
  影响原始信息资源知识价值的因素有很多,主要包括资源的唯一性、相关价值、对相关主题领域理解的重要性、对相关主题领域覆盖的广度和深度、实用性和准确度、特定主题领域中其他载体记录质量差的信息内容、具有强化项目实施的历史价值以及数字化产品潜在的长期价值等。另外,文献知识价值也可能包括管理价值、艺术价值、证据价值和市场价值。文献知识价值的判断具有很大程度的主观性,分类不同,对文献知识价值的判断也不相同。
  2、知识产权原则
  馆藏资源的产权状态识别与数字化项目实施、数字资源发布所在的国家地区有关,每个国家都有自己的知识产权保护法律。学者针对图书馆信息资源数字化项目制订了产权状态识别模型,馆藏资源的产权归属有四种情况
  (1)馆藏文献通过接收的方式,把原本属于国家所有的文献收进馆中,这种文献的所有权和著作权都属于国家所有,图书馆代为行使。图书馆在遵守有关法律的前提下,有权根据需要自主进行数字化。
  (2)图书馆通过购买集体或个人所有的受著作权法保护的作品。如果图书馆没有购买其著作权,则著作权仍属于原所有者。在这种情况下,图书馆要对此类档案进行数字化,必须在征得原所有者的同意,并向其支付一定的报酬后方可进行,否则就构成了侵权。
  (3)馆藏中的一些文献资源是通过受捐赠的方式得来的,捐赠人一般只是将文献实体所有权赠给图书馆,自己仍保留著作权。所以在数字化这类文献时,与通过购买方式得来的文献一样,同样要征得文献著作权人的法定许可,并向其支付一定的报酬后方可进行。但也有捐赠者,声明将所有权和著作权一并捐赠给图书馆的情况,这种情况除外。
  (4)一些寄存在图书馆里的文献资源,寄存只是由图书馆代为保存,不发生所有权和著作权的转移。这种情况下,图书馆在进行数字化之前,必须征得文献资源所有者的同意,否则就侵犯了文献所有者的权益。目前数字化项目中保护产权的主要技术有对每个数字图像添加可视水印或版权戳,给数字图像添加不可视水印,这种水印标志可以用来证实数字图像的版权身份,也可用来跟踪这个数字图像在因特网上的传播轨迹:对数字图像加密,把密钥发送给注册用户,这种方法会限制公共存取;将公共浏览的图像限制在低分辨率;将公共存取限制在截取数字图像的一小部分之中,这种方法在一些项目中应用得非常成功;将图像的浏览权限定在注册或被授权的用户群中。
  3、能获得更多的用户的原则
  用户利用的本质就是馆藏文献的利用率,从理论上讲,图书馆信息资源数字化项目应把有限的资金用在利用率高的数字化资源上。但一些问题需特别关注;
  (1)要对利用率高的文献的原因进行分析。如果主要用户群体分布在本地,且类似文献又不存在,这类文献的利用率自然可能高:但数字化后发布在网络上,其利用率如何就比较难以判断,因为这时的用户就不仅局限于本地了。
  (2)文献的利用率与文献的知识价值并不完全一致。有些具有高知识价值的文献由于存放地点、图书馆存取方针的限制、目录的不完整等因素,可能导致利用率偏低。比如说,西南政法大学的法律外文图书,对读法律的学生来说非常有知识价值。由于这些书经济成本很高,一般每本书要几十上百美元,折合人民币就是几百上千,为了降低这些图书的丢失率和预防别人翻版,所以这些图书只能复印,并且不用复印全本图书。
  (3)利用率也会与文献的物理状态有关。部分文献的物理状态限制了用户对其的访问,比如易碎载体的文献、古旧的手稿等。如西南政法大学图书馆的法律古籍,许多都是线装书,并且纸张都已经发黄,很容易损坏,如果开放任读者随意借阅,会使这些珍贵的古籍被损坏,以致消失,这对西南政法大学图书馆乃至整个法律界都是一个不可估量的损失。
  (4)在多馆合作数字化项目中,一些大部头的系列文献分散在各成员单位。对这些实体文献的访问率可能较低,但数字化后形成完整的虚拟馆藏,其访问率就可能会提高。
  (5)技术因素不应该成为阻止一些文献数字化的原因。比如,一些文献的数字化文件的格式或像素致使其在网上传播速度慢,乃至难以浏览。但网络技术的快速发展使这些问题可能在数字化周期之内就能得到解决,另外文献数字化后的格式改变也是促进技术发展的一个重要动因。
  4、原始文献存在状态原则
  在数字化内容选择过程中,与原始文献存在状态相关的问题有:原始文献的存在状态是否有利于数字化,其内容是否能被目前的数字化技术完全和充分地抓取,物理材质和形状是否会对数字化过程构成障碍,是否有保存良好的替代品等等。最常见的物理材质有一般纸张、牛皮纸、草纸、微缩胶片、光学材料、三维物体、玻璃器皿、记录音频和视频的盒带光盘和磁带等。不同物理材质的文献需要不同的技术进行数字化,比如一般纸张可以采用数字扫描,但三维物体只能采用数码拍照。存在状态对其内容的充分抓取也有重大影响,比如一般纸张中内容的抓取要比草纸充分得多,甚至有些物理材质的内容数字化目前还难以实施。所以,只能选择那些当前技术条件下适合于数字化的载体材质馆藏资源。载体的物理尺寸也是影响内容选择的一个重要因素,比如常见扫描设备对大型地图和海报进行数字化很困难,这时对其替代物进行扫描就成为一种较好的选择。载体的健壮性对数字化内容的选择也会产生影响,比如一些珍贵或易损的资源需要在特殊环境中数字化:牛津大学的"难民研究数字化项目"和耶鲁大学的"开放图书项目"支持资源载体的拆分,以提高数字化设备的吞吐量;健壮性的另一个体现是对数字化处理的特殊要求,如牛津大学的"塞尔特语和中世纪手抄本数字化项目",要求设计一种特殊的保护托架来放置手稿。
  5、经济效益原则
  馆藏文献的数字化成本受众多因素影响,分辨率越高的图像所需的成本也越高,彩色图像的成本要比黑白图像的成本高。数字化生成的纯文本文件有助于全文检索,且占用的存储空间较少,但需要OCR识别,并需要大量的人工校对;如果生成带标记的文本文件,虽然有助于各种分析乃至纳入数据库管理,但成本必然会相对增加。成本也取决于数字化过程,比如单页扫描比装订在一起扫描成本要低:保存状态良好的资源扫描要比保存状态差的资源扫描所需成本低,因为后者需要更多的人工处理。从效益角度看,最大的受益者是用户。
  另外,数字化也便于对馆藏资源的管理,并能更高效地提供服务,尽可能提高成本效益是数字化内容选择的宗旨。实现相同功能而采用不同方法的成本会有所不同,比如数字化生成文本文件与生成图像文件,后者加入元数据与图像文件链接,两种方法得到的效果可能相差无几,但很明显后者的成本要低些。另外,规模很大的项目单件数字化成本要低,长期保存的费用也会降低。
  6、避免重复数字化原则
  对于已有数字化版本的馆藏,避免其再次数字化是目前内容选择的一个基本原则。很多人都觉得数字图书馆有利可图,于是国家图书馆、各地区、各行业图书馆甚至是一些企业都一哄而上,从自身利益出发,纷纷建立个字的数据系统。者造成内容上缺乏明确的分工,相互之间在技术上、数据格式和标准并不兼容;把注意力放在力图"最大"、"最全",无法实现资源共享,形成"信息割据"的局面。
  要考虑已有数字化版本的质量、记录状况和功能是否能够满足用户的需要,以及获取数字化版本的条件,甚至还要评估获取数字化版本与重新数字化两者所需费用的差别。一般来讲,自己再数字化的成本要比获取数字化版本的费用高,如果确实需要这部分数字化资源,可以向资源的所有者购买使用权。这样就可以节省自己图书馆的开支,也能满足使用要求。在其它条件都允许的情况下,最好不要重复数字化,不然都会造成对金钱、时间、人力、物力的浪费。
  7、技术条件限制原则
  数字化内容选择受现有技术条件的限制,我们在选择数字化内容的时候必须要考虑现在的技术是不是能够顺利地把所选内容数字化。考虑的主要因素有:数字化过程中对原始资料识别的技术问题,会导致数字技术生成的文献数字版与原始文献包含信息相比错误很多;数字资源显示在用户终端的质量:图书馆支持的技术平台和网络环境对数字资源的存取能力;数字资源网络传播速度能不能满足要求;预测未来用户使用设备的先进程度,以免日后需重新扫描;搜索引擎对图书馆数字资源的索引能力等。
  另外,还要考虑一些特殊资源数字化的技术可行性。如,需要超高分辨率的文献资源、颜色至关重要的原始资源、超大尺寸的资源、三维形态的资源以及易读性很差的资源载体等。
  图书管理在进行数字化内容选择的时候,只有满足了以上的原则,数字化才可行并且有价值,才能给图书管理和学校师生都带来好处。
  (作者单位:广西机械高级技工学校)
网站目录投稿:丹冬