徐娟+刘大巧+赵学敏+李国红 【摘要】随着高校规模的不断扩大,高校在教学科研、人才培养及社会服务等过程中产生的数据以指数级速度增长,传统的档案存储模式已经无法适应档案数据增长的矛盾。与传统的存储模式相比,云存储以其成本低、高效、海量存储等优势越来越受到人们的关注。但不可忽视的是使用云存储模式实现高校档案存储也存在着一定的问题和风险。本文详细分析了高校档案云存储实现的特点和优势,此外针对可能存在的问题和风险,提出了相应的解决方案。 【关键词】大数据;高校档案;云存储 高校档案是高校教育教学活动的真实记录,是高校从事教育教学活动、高校管理、教学科研工作必不可少的参考借鉴资料。高校档案不仅是高校政策决策的重要保障,也是高校日常管理决策不可或缺的资源。 然而,随着计算机网络、云计算等信息技术的飞速发展,整个社会已经迈入了大数据时代,高校也不例外。在大数据背景下,高校学生的学籍、发表的论文、课程成绩以及教师的基本信息、教学课件、发表的科研论文、参加的科研项目等会产生大量数据,同时还有实验室设备、学校机房和行政部门产生的档案信息等也会产生海量数据。除了在学生培养方面会产生海量数据外,高校行政管理活动、科研和学术交流、社会服务等方面也都会产生海量数据,这些数据数量大,数据结构多样,数据来源广泛,明显具备了大数据的特征,对这些有价值的数据信息进行归档存储,并确保在需要时能被有效地查询和利用,这将成为高校档案部门无法推脱的责任,同时也为高校档案工作带来巨大的挑战。目前高校档案管理面临的最主要的两个挑战:一是如何为档案数据提供足够大的存储空间。二是如何为用户提供一个更安全、高效、方便的档案访问平台。幸运的是,面对大数据带来的挑战,云存储技术应运而生。简洁地说,"云存储"是将数据资源存放到网络上供人们查询的一种新兴方案。用户可以在任何时间、任何地方,通过任意可上网的设备方便地存取数据。现在许多国内外的大公司如微软、亚马逊和谷歌已经引入了相关的云存储平台服务。在大数据背景下,如果能将云存储技术应用到高校档案管理领域,不仅可以解决以上两个挑战,也将会为高效档案事业带来历史性的变革。 一、云存储在高校档案管理中的优势 (一)云存储技术的应用,能降低高校档案管理的成本,提高档案资源的利用率。传统的数据存储都是静态的,多用于存储PB级以下的数据。若采用传统的存储架构,当存储容量需求增加时,就需要添加新的存储阵列。随着需要管理的阵列数增加,存储环境变得日益复杂,管理难度更大,需要的运营成本也随之增加。而云存储能够实现动态扩展,按需求进行配置。各高校档案馆可以根据自身需求申请适当的存储容量,无须额外的存储设备,相比较传统存储模式,降低了购置设备的成本。存储平台的运行和维护工作由云存储提供商完成,降低了高校档案管理系统运行维护的成本。云存储提供了一个较为开放的访问平台,用户可以随时随地通过任何可上网的设备访问档案资源,这就解决了某些用户由于时间、地点等因素限制而无法实时访问档案资源的问题,从而大大提高了高校档案资源的利用率。 (二)云存储技术的应用,能为档案数据提供海量的存储空间。随着高校档案信息化建设的不断加快,高校档案数据也由原来单一形式向电子文件、图像、视频、音频等多种形式发展,高校档案馆要安全存储这些数据,需要不断扩充服务器和相应的存储设备,这会给高校档案馆带来很大的资金压力。由云计算发展起来的云存储平台,用户只需要利用几台可以上网的电脑终端就可以方便地上传和下载存储在云中的电子文件。云由成千上万的存储设备和服务器集群构成,它具有无限的存储空间和海量的存储能力,能够更好地满足档案数据海量增长的存储需求。 (三)云存储技术的应用,能增强容灾、异地备份能力。云存储可以实现跨领域部署,并可以通过虚拟化技术实现多物理存储节点、多应用系统和多业务服务协调的共享存储构架。特别是当发生不可预测的数据灾难时,通过云存储的分布式备份功能可以实现档案数据的快速恢复。同时,云存储可实现数字档案网络在线异地备份,以上两类功能可避免各高校档案馆单独存储档案数据时遭遇停电、火灾、水灾、地震等特殊灾难情况时可能带来的档案数据丢失和损失。 (四)云存储技术的应用,能实现档案数据中复杂数据类型的虚拟化存储。采用云存储所具备的虚拟化技术和大数据管理技术,能实现很好地复杂数据类型的虚拟化存储。特别是针对特殊类型的档案,如:电子期刊、古典文籍、照片资源、音频视频文件等。 二、云存储在高校档案存储中的存在的问题和风险 (一)云存储平台的安全风险。高校档案的保密性以及档案工作的机密性决定了高校档案存储需要一个相对安全的存储环境,现有的高校档案存储方式在档案安全存储方面有一定的优势。首先,云存储自身的虚拟化、无边界性、流动性等特性,使得其面临较多的安全威胁。其次,与传统的存储方式不同,云存储是将数据信息存储在云端,这对数据的存储安全、传输安全、服务安全和访问控制都带来极大的挑战。同时,云存储应用导致网络资源、信息资源、用户数据和应用的高度集中,由此带来的安全隐患与安全风险也较传统应用高出很多。目前为止,还没有任何一家云存储供应商保证可以提供绝对安全的存储平台。此外,如果将不能公开的数字档案以远程方式存储到云端,必定会引发档案管理者的担忧。 (二)云存储的可靠性问题。大多数云服务供应商都对云存储的安全性做出过承诺,但亚马逊弹性云服务出现的服务中断事件以及微软出现的云数据托管中断事件都表明用户能否访问到自己的云存储数据取决于云服务提供商的服务是否可靠,一旦云服务供应商出现问题,用户则无法正常访问自己存储在云服务上的数据,因此可靠性问题是目前云存储急需解决的难题。 (三)缺乏可靠的国内云存储供应商。现在大部分成功的云存储供应商都是Google、微软等国外品牌,尽管国内的一些IT公司正努力追求云存储技术,但就技术水平和发展规模来看还存在一定的差距。当高校档案选择云存储方式,云平台就控制了档案数据,这将会导致潜在的数据威胁行为,例如通过数据挖掘技术挖掘机密的档案信息。因此,在某种程度上我们更希望找到一个具有独立R&D 认证的国内云存储供应商,最大程度地保证高校档案的安全性和保密性。 (四)缺乏统一的云存储技术标准。在技术层面,对于长期有效存储数字档案尚存在很多需要解决的问题,其中最重要的问题之一就是技术标准问题。想要实现数字文件长期、高效地存储,必须制定一系列的统一的存储标准。然而,到目前为止国际上还未形成一套公认的数字档案信息长期保存的标准,这有可能导致在将档案数据上传到云端的过程中产生数据丢失、错序等问题,从而直接影响档案数据的完整性和一致性。 三、高校档案云存储实现的观点 (一) 积极参与档案云存储设计。高校应该以档案管理部门为领导,由各部门共同支持建立起一个较为全面的档案管理系统,从而避免过多地依赖于云服务供应商。在档案管理系统的核心设计以及资源建设过程中,高校内部应该制定一套统一的安全标准和机密性协议,所有的档案管理人员都应积极参与档案云存储管理系统的设计与实现,学习云存储相关的知识,建立一个规模合理的档案管理系统。考虑到高校档案的保密性要求,在云存储供应商进行系统维护以及业务合作过程中需要建立一套严格的机密性协议,以降低档案数据泄密的风险。 (二)建立高校档案私有云。云服务按部署方式和服务对象范围可以分为三类,即公共云、私有云和混合云。公共云通常适用于大规模和多用户。相对于公共云和混合云,私有云的用户完全拥有整个云中心设施,提供了更多地安全和保密等专属性的保证,因此在安全性、法规遵从以及服务质量方面更加具有保障。高校档案管理选择私有云可以保障在使用云存储技术的同时最大程度地维持对档案数据的控制权,提高档案的安全性和保密性。 (三)建立云存储平台下的档案数据的安全备份策略。采用云存储技术存储高校档案数据后,相应的备份策略也会发生根本性的变化,由脱机备份转换为网络在线备份。为了提高档案数据的存储安全和灾难恢复能力,高校可以选择对档案数据进行多套备份,通过将档案数据副本在本地、同城和异地进行备份的策略,实现档案数据资源的多套多地备份,这不仅能够提高档案数据访问的实时性和共享性,更加增强了档案数据的容灾能力。对于重要的、机密的高校档案数据应该做好提前备份,一旦云存储数据库遭受致命损坏时,可以立即启动备份系统以确保高校档案数据的正常使用。 (四)加强云存储人才的建设和培养。将档案数据向私有云迁移时,需要采用成熟的技术方案,解决私有云的系统建设及运营管理安全工作。同时,应做好系统容灾、数据备份,以及业务回退机制,以提高应对各类突发事件安全事件的处理能力,这些工作都离不开掌握相关技术的IT技术人员。管理档案系统的IT技术人员不仅要有较为深厚的计算机背景知识,还需要熟悉档案的相关知识。因此,高校档案馆建设要注重人才的建设和培养,做好人才的储备工作。 四、结语 云存储技术的出现为高校海量档案数据的高效存储和利用提供了新的平台,为高校档案的管理工作指明了新的发展方向,高校档案管理工作者应积极投入到高校档案私有云建设中,充分利用云存储的技术优势。同时,也要重视高校档案云存储中存在的问题和风险,尤其是档案安全和保密问题,积极提出相应的策略。 本文系云南省档案科技项目"基于Hadoop云平台的高校档案资源管理研究"(项目编号:2016-y-125-006)研究成果之一。 【参考文献】 [1] Zhao Yi. Opportunities and risks: Electronic document management under cloud computingenvironment [J]. Journal of Archives and construction, 2013(10):4-7. [2]张桂刚,李超,张勇,邢春晓.一种基于海量信息处理的云存储模型研究[J].计算机研究与发展,2012(S1):32-36. [3]朱悦华,何丽萍,丁建萍."云档案"信息资源共享系统研究[J].浙江档案,2012(6):52-53. [4]薛四新,陶水龙,崔伟.数字档案馆云计算建设模式的思考——以北京市区域性数字档案馆为例[J].档案学研究,2012(3):62-64.