【摘要】在大数据环境下,本文对档案信息化建设前的准备工作,以及档案工作在信息化建设过程中应注意的一些问题进行研究分析,以促进大数据环境下做好档案信息开发和利用工作。 【关键词】大数据;档案信息;开发利用 随着信息时代与网络时代的到来,大数据环境给我国各行各业带来新机遇和挑战。档案工作部门作为提供信息的重要部门,要跟随时代发展的潮流抓住机遇并迎接挑战。重视档案信息化建设,利用好大数据的优势,进一步把档案信息化工作做好,更好地为单位和社会服务,是每个档案工作者必须承担的历史使命。 一、档案信息化的前期准备工作 (一)实现档案原件的全文数字化。对纸质档案原件进行全文数字化,是档案信息数据上网运行的前提条件,也是大数据环境下开发档案信息的基础。在此基础上,才能对档案信息进行分类,建立档案数据库和档案查寻系统。目前,各级各类档案工作部门开发和提供上网利用的档案信息仅仅是二次信息,即目录、索引和文摘等,而对作为一次信息的档案全文信息以及图形图像信息却开发得很少,用户在网上只能看到档案的索引、目录,却看不到档案全文。这样,大数据的优势仍然无法显现出来。为了满足大数据环境下档案信息的提供利用,当务之急是实现档案的全文数字化。档案的全文数字化就是将各种形式的档案信息,如文字、图像、声音、动画等,以数字记录的方式全部存储在光盘或磁带等磁性载体上和计算机硬盘上,并能通过计算机网络再现这些信息的过程。这是档案工作部门的一项长期而艰巨的任务。按照传统的观念,档案信息数字化是档案管理的基础工作,不属于档案信息开发工作范畴,但在大数据环境下,各项工作已形成了一个真正意义上的整体,各个环节相互连接、相互制约,档案信息数字化已成为档案信息开发工作中最基础的环节和前提条件。 (二)建立档案信息数据库。在档案信息数字化的基础上,各类档案工作部门应根据自己的库藏特色,建立档案数据库,这是大数据环境下档案信息开发工作的第二个环节。数据库不应是简单的档案信息储存系统,更应该是对数字化的档案信息进行深入加工和组合之后形成的专题性的、高层次的档案信息的科学分类组合。它可以按照档案的保管单位形成全宗数据,可以按照社会领域形成政治、经济、法律、教育、文化等各领域的专业数据,按照地域形成地域特色数据,按照检索的层次可以分为目录数据、索引数据、文献数据或全文数据等等。这样,可以提高查询速度,方便用户,同时提高档案信息的管理水平。 (三)建立档案信息网站。网站是网络上的节点,是由相关的网页组成的用来发布信息的完整结构。档案部门可以通过建立网站,改变传统的档案信息开发和利用方式,以适应网络环境。建立网站包括这样几个步骤:制作网页、连接数据库、挂接检索系统、建立反馈和通信机制、建立安全管理机制和网站维修机制。网站建立后,经过开发的档案信息,可以在几秒钟之内与利用者见面,大大缩短了信息传递时间。利用网络技术,发挥其实时性功能来开发档案信息,可以使档案信息的传递速度提高几十倍、甚至上百倍,在时间上可以最大限度拉近档案信息与用户之间的距离,并在一定程度上解决档案信息传递滞后性的问题,这是传统的档案信息开发手段所不能比拟的。现在全国档案信息资源的网络化、数字化建设开始进入争先恐后的具体实施阶段。 (四)注重档案的保密性。我们在开发档案信息网络化时应注意档案的保密性,并按档案的开放程度进行划分。档案的开放程度可分为三个层次:一是开放档案;二是限制利用档案;三是保密档案。按规定,开放档案可以向社会公开提供利用,限制利用档案限制在一定范围内(档案的形成者和其他相关人员)提供利用,而保密档案则限于解密之后提供利用,有的档案则将永久保密,永远不能与世人见面。在大数据环境下,我们应根据档案开放程度来确定对以上各类档案的开发形式,以适应网络的开放性环境,并保证档案的机密性。对于开放的档案信息,我们可以用网页的形式上网传输,提供开放性利用。对于限制利用档案和保密档案,可将其数据存入加密查寻系统中,然后,采取密钥控制技术和身份验证技术,实施限制性开发和利用。 (五)扩大档案的影响力。目前,社会上的档案意识并不是很高,不少人只知有"图书馆",不知有"档案馆",将"档案"误为"党案"的事例屡见不鮮。通过网络向社会广泛宣传和进行《档案法》的教育,是快捷、有效的方法之一。目前,有部分省市档案馆(如北京市档案馆、上海市档案馆、山东省档案馆等),纷纷在网上挂上自己的主页,有的还在网上建起档案目录查询系统,其目的是向社会宣传自己,提高档案部门和档案工作的知名度。通过越来越多的网上档案目录中心的建设与投入使用,社会公众在利用查询档案信息的同时,无形中也会增强公民的档案意识。 二、在大数据环境下档案工作应考虑的问题 (一)档案网络统筹规划、相互兼容。统筹规划,相互兼容的原则就是要考虑上级或外部网络系统及下级或内部网络系统。从档案信息资源开发的角度来说,要考虑社会对档案信息需求的层次和范围。并且形成以档案馆为龙头的有效开发档案文献信息资源的区域网络服务中心,最大限度地满足企事业单位和个人档案信息需求;形成以政府专业管理部门、行业协会、科研、学校等单位档案室为骨干的行业网络服务中心,最大限度地满足科技和专业管理人员的档案信息需求。在建立档案信息互联网络的同时,也考虑与当地的信息港、情报所、图书馆等其他社会信息服务统一和专业管理信息服务系统的兼容性。充分发挥档案部门自身的信息优势,避免网络信息服务设施、信息采集内容的雷同和重复建设。 (二)网络系统与实际情况相适应。利用计算机网络管理档案的优点毋庸多言,但档案馆建网时要从实际情况出发,要与本地区的投资力度、硬件设备、技术人才、信息利用能力和未来的发展相适应。网络建设投资大,财力不足,就很难建网。同时网络的运行管理需要技术人才,没有相应水平的技术人才,建成的网络如同无人驾驭的汽车;建网的目的是利用,如果档案馆不考虑社会大众对档案信息需求范围,仅仅利用计算机应付日常打印文件、卡片、案卷目录、卷内目录,那么网络的建设不但造成网络设备的闲置、浪费,还要支付大量的网络通信费用。 (三)投资与效益相得益彰。网络的建设投资数额大,特别是建设能满足长远发展需要的网络投资更大。目前,我国各级档案馆的经费比较紧张,因而网络建设一方面要从经济角度,分析建网所产生的经济效益和社会效益,另一方面要量力而行,从经费的实际情况出发,不能打肿脸充胖子。这就要求我们在建网时,拟定好建网计划,控制年度经费的投入比例,先考虑人才培养、软件建设和基础建设,后考虑硬件投资。与此同时,档案部门要认识到自身保存档案信息的潜在价值,增强资源开发的合作意识,充分利用其他信息部门的硬件设施,共同开发,共同受益。 (四)软件同硬件的"门当户对"。目前,有些档案部门在进行计算机管理档案目录时,没有考虑社会对档案信息的需求,按照档案馆传统的做法,选出一些自己都认为利用价值不高的档案,在著录档案提要、主题词过程中,又没有严格按照技术规范操作,仅自行编制了一些应用管理软件,出现了各自为政,没有统一规范和标准的现象,这就使网络不能真正发挥出优越性。这就是说我们不仅要建网修路搭桥,同时还要考虑计算机"车辆"、信息"货物"和管理软件的匹配问题。为此,建网时不但要系统地考虑造路上网,道路畅通等外在条件,更重要的是考虑信息"货物"质量和数量等内在条件。没有含金量较高的档案信息,就如同没有货物的列车在铁道上飞驰,到头来劳民伤财,必然造成资金的极大浪费。 (五)改变传统的工作方式和服务方式。我们要变"等客上门,你来我找"为主动服务的方式。长期以来,档案系统提供利用服务方式都是"等客上门,你来我找;查到说有,查没说无",这种被动的服务方式与当今快速多变的社会需求已经很不适应。如何改变被动服务为主动服务,是档案部门喊了多年的口号,然而借助网络互联技术,实现档案信息为社会公众服务的多渠道、无时差、零距离,应是一种极为有效的手段和途径。 三、结语 总之,在大数据时代,我们要转变传统观念,采取多樣化的方式为社会及公众服务,主动降低门槛,如提供网上档案检索或利用服务,做好档案信息开发和利用各项工作,为档案工作与社会提供一个良好的交流平台,更好地为国家、社会、集体和个人服务。这样才能在大数据时代与网络环境下更好地开展档案工作和发展我国的档案事业。 【参考文献】 [1]李瑞,姜钦芳.大数据环境下档案资源管理工作方式研究[J].陕西档案,2019(12). [2]顾睿涵.大数据背景下档案数据管理探析[J].兰台内外,2019(10). [3]芦春媛.大数据时代档案管理的优化与发展研究[J].企业改革与管理,2019(09). [4]於菊红.大数据背景下档案管理范式的转型:从信息管理到数据管理[J].档案管理,2019(11).