【摘要】数据库的建设是数字图书馆资源建设的重要内容之一。数据库(database)原本为计算机行业的专业用语,其本质就是数据的排列与集合,并且该排列与集合可以被查询和调取。在数据库建设的各种标准的制定中,著录和标引规则是重中之重,它直接影响图书馆数据库的质量。 【关键词】图书馆;数据库;问题 数据库的建设不仅仅是将纸本文献、音视频文献数字化的过程,而是要运用现代信息技术对纸本资源、音视频资源进行加工、处理的过程,从而实现从篇名、作者、作者单位、分类、关键词、日期等多途径检索。尤其是全文数据库、多媒体数据库的建设,既有利于纸本文献、珍贵图片、声音、影视等资料的保存和传播,也有利于广大读者的学习与利用。但是目前学校图书馆自建数据库的过程中存在一些不可忽视的问题。 一、数据库建设缺乏统一的规划、分工与合作 学校图书馆数据库建设是一项长期的系统工程,周期长、投入大、见效慢。长期以来,学校图书馆由于体制及隶属关系的原因形成了管理体制上条块分割,在客观上为统一分工、合作建设数据库增加了难度,再加之闭门造车、急于求成的现象十分严重,形成了各馆单独建设专题数据库,并普遍存在结构单一、规模小、专业面过于狭窄、缺乏建库规范和数据的录入标准等问题,影响了数据库的使用效率,产品的市场化、商品化更是无从谈起。 二、数据库制作的规范和标准化程度低 标引、分编、检索点选取没有严格的质量控制,数据库的建设各自为政,分别基于不同的系统。低水平的数据库在本馆或小范围内或许能够使用,一旦上网联机在全球范围内调用,它们的缺陷立即会显露出来,仅不同计算机系统的互联和数据的统一规范就会出现很多麻烦,甚至会严重到无法上网交换成为废库。 三、数据库在类型上比较单一 中文数据库居多,外文数据库、多媒体数据库偏少。单一类型的数据库只能给用户检索提供部分的帮助,不能满足读者从多渠道获取文献信息的需求,因此只有单一类型数据库的图书馆是不能令用户满意的。 四、学校图书馆数据库建设过程的方向把握不准确 馆藏文献数字化要把数量如此庞大的印刷型文献转化为数字化,不仅任务十分艰巨,而且数字化还需要大量的技术、设备、人力、资金、文献作保证。目前,同时具备上述条件的图书馆不多,中小图书馆就更是凤毛麟角。因此,学校图书馆还没有能力开展大规模的数字化工作,只能根据现有的条件对部分文献实现数字化,逐步推进此项工作。然而,一些部门的决策人错误地理解"发展"二字,片面追求数量,为了扩大政绩,他们不顾有无技术基础、设备条件、经营经验与经济实力,盲目建库。数量倒是增加了,但原本就相当紧张的人力、物力和资金被不断分散,不仅所建的数据库质量得不到保证,而且影响了学校图书馆日常工作的正常开展,真是有百害而无一利。 五、重复采购,保障率低 学校图书馆为了克服订购书刊资金的不足,不得不采取保刊压书、保品种压册数、保中文压外文的办法,集中在核心期刊、常用书刊的订购上。这种自我满足、实用化的原则便产生了你有我有、我无你无、重复率高、保障率低、学科覆盖能力低、难以形成有特色的馆藏文献资源,依据这样的馆藏"文献资源"所建成的数据库,其质量就可想而知了。在网络技术如此发达的今天,是完全应该避免的。 六、检索效果未尽如人意 一个可行的专题数据库检索系统应是外部特征检索、主题检索、分类检索、全文检索的综合应用。目前,已经建立的专题信息数据库大多只有外部特征检索和文本方式的全文检索两种检索途径。一般的用户都能快速简便地从作者、标题、日期、版次等外部特征入手查找资料,但前提是用户已事先知道要查找的资料所在的日期及其他信息,否则,用户要想扩大或缩小检索范围,查全查准资料,并非易事。数据库缺乏科学的、辅助的检索工具,影响了它的使用效果。 七、数据加工存储的格式众多 以文本方式存贮的全文检索,具有占用存储空间小、不需人工标引加工、便于查找文章细节、检索结果直接可靠、检索详尽彻底、使用简便易学等优点,但在不进行任何控制的情况下,文章中的每一个字、词均可成为检索点,无形中加重了检索方面的负担,使每次检索的文献量偏多,筛选量过大,用户检索所需时间长,直接影响了查准率,造成了检索噪音。 以图片方式存储的全文检索,必须进行耗时、费工的人工标引和技术加工,其标引难度很大,对"原文"内容又不能直接地逐字、逐词进行检索,由于"原文"采用链接方式,检索速度相对较快,但占用存储空间大,对古籍、档案、照片和含有特殊公式、符号的科技文献能进行原貌保存。因此要提高查全率、查準率,就必须提高文献的标引深度和数据的加工质量。 八、人员素质及其知识结构影响数据库的开发 在实际工作中,往往是精通开发数据库的计算机技术人员一般都不了解数据所涵盖专业知识,因而造成对文献分类标引、主题标引的质量不高,不清楚自己制作的数据库软件是否科学、合理、易学、实用。同样,从事文献信息标引的专业人员通常都不懂得计算机程序编写及系统设计等知识,或是只懂得一些计算机的基本操作。因此,常常由于双方的沟通和知识结构差异的问题,都会不可避免地、或多或少地影响数据库的开发进程。 【参考文献】 [1]董焱,刘兹恒.图书馆馆藏文献数字化:虚拟图书馆信息资源建设的重要内容.图书情报工作,2000(7):52~55.