【摘要】 随着大数据的产生和发展,大数据和大数据处理技术必然对审计行业产生重大的影响,传统的审计技术和审计流程面临巨大的挑战。在虚拟化、海量化的大数据环境下,传统的手工审计技术和孤立的"一对一"审计流程已不能适应审计发展的本质需求。文章基于对大数据的本质特征和对审计影响的深入分析,利用大数据处理技术推动审计的技术革新和制度创新,重构大数据环境下的审计实施流程,搭建大数据持续审计模式的基本框架,推进我国审计信息化建设,增强审计监督服务的效能发挥。 【关键词】 大數据;大数据审计;流程再造 【中图分类号】 F239 【文献标识码】 A 【文章编号】 1002-5812(2019)03-0029-04 一、引言 大数据作为互联网发展中的新兴产物,正在逐渐影响和改变人们的思维模式,在各个行业、各个领域得到广泛运用。审计作为一种数据分析的鉴证活动,正需要大数据的大量、快速处理技术来提高审计效能,大数据给审计工作的飞跃发展带来了不可多得的机会。但是另一方面,在大数据环境下,审计面临的情况更加复杂:数据呈现海量化、虚拟化、分布散乱等特征,传统的审计技术、审计流程可能面临取数困难、分析困难、查证困难。因此,2015年12月9日中办、国办印发的《关于实行审计全覆盖的实施意见》提出,要构建大数据审计工作模式,提高审计效率和质量。那么,什么是大数据审计工作模式?如何开展大数据审计?目前都还处于探讨之中。本文以此为契机,利用大数据处理技术推动审计技术的革新,重构审计实施流程,搭建大数据持续审计的工作模式,推动审计信息化建设,有效发挥审计监督服务的效能。 二、大数据与大数据技术 (一)大数据 大数据(Big data)也称海量数据,顾名思义就是数据量大,其体量可以达到数百TB甚至PB级。最先系统研究和应用大数据的先驱者麦肯锡公司从工具处理角度把大数据定义为无法用传统的软件工具在短时间内进行获取、分析和管理的海量数据。维基百科从人工处理的角度将大数据定义为在一定时间内人工无法进行采集、处理、分析并从中获取有用信息的大体量数据集合。从审计的角度看,大数据应是被审计对象的海量数据集合,包括传统的财务账套数据、台账明细账形式的业务数据以及外部相关联的结构化和非结构化数据。 从以上定义可以看出,大数据的内涵已经超出了传统意义上数据的标准。不仅表现在体量上的"大",而且还在于传统的工具对其处理的难度上的"大",且在本身性质上还出现非结构化等不规则的特征。一是数据体量巨大。数据不仅在形式上由纸质向电子数据转变,而且在体量上也呈几何速度的增长,数据计量单位也从传统的Byte、KB、MB、GB发展到TB、PB、EB、ZB、YB,甚至用BB、NB、DB来衡量。二是数据结构复杂。类型多样,呈现多元化、非结构化特征,如虚拟技术产生的虚拟数据中心数据,以文本、图像、声音、影视、超媒体等形式的非结构化数据等。三是数据处理难度较高。对数据的采集方式、传输方式、存储安全提出了更高的要求,也加大了数据的分析难度和管理难度,传统的手工处理方式和一般的软件工具在规定的时间要实现整个过程的处理是难以实现的。 (二)大数据技术 1.大数据采集技术。大数据采集和传统手工数据采集有着本质的区别,根据采集与被采集双方的网络架构情况,可以分为软件接口方式、数据库接口方式和底层数据直接交换方式等。 软件接口方式一般采取现场采集方式进行。通过与被采集对象软件接口标准相容的采集软件与被采集数据库建立连接,现场采集所需数据,然后经过建立中间表转换成采集方所需的有用数据形式。此种数据采集方式类似于传统意义上的手工现场数据采集,只不过在数据采集的方法上产生了变化。 数据库接口方式一般以远程采集方式进行。这种方式是采集方与被采集方以因特网、内部专网或政府政务外网等方式建立网络连接,采集方事先在被采集方数据库安装数据接口软件,通过该软件接口的访问权限可直接访问被采集单位数据库从而实现数据采集。 底层数据直接交换方式是指通过引擎软件或仿真技术对被采集对象的底层数据交换进行侦听,对目标软件客户端和数据库之间的网络流量进行分析,从而采集或自动写入所需数据方式。 2.大数据存储技术。大数据存储技术是充分利用因特网和云计算技术来实现安全、大容量存储。一是以太网硬盘存储,即采取以太网连接的动能硬盘形式,数据直接经过以太网接口进而存储到硬盘中,精简了数据到硬盘之间的传输环节,且其存储容量和性能比现有的硬盘高达四倍。二是云端存储,即通过专业的服务商建设云存储中心,采用大量的专业服务器来存储数据,数据客户与云存储中心通过网络连接,通过权限访问、下载和使用数据的方式。云存储中心不仅具有高容量和高扩展性,而且数据安全得到了保证。 3.大数据分析技术。大数据分析技术是通过大数据分析工具和分析方法对获取的数据进行计算进而实现预测分析、并行计算、数据仓库、可视化分析等。预测分析是指通过计算、指标分析、比较分析、趋势分析等分析方法估计、推算未来结果或发展趋势的一种分析技术,为决策优化、预报模拟等用途提供支撑信息;并行计算是通过问题分解协同解决大型复杂问题的方法,即把同一个问题分解成若干组成部分,每个组成部分均由一个独立的处理器来并行计算,这样多个处理器并行运行协同求解同一问题,从而提高处理速度和效率;数据仓库是联机数据分析和多维数据挖掘系统,即为了便于让企业了解整个数据全貌和进行多维分析和处理而建立的关系型数据库决策支持系统,能够帮助决策者快速地从大量的数据中挖掘出有价值的信息,构建商业智能;可视化分析是指以简单、直观的图形化、图像化的形式呈现给用户,直观地展示数据,让数据说话,让观众听到结果。 4.大数据挖掘技术。数据挖掘是大数据分析的核心技术,是指通过数据挖掘方法对大量的数据进行处理,揭示其中隐含的、先前未知的并有潜在价值的信息。主要包括数据清理、数据转换、数据分析、知识表示等步骤。数据清理是剔除数据中一些无用的冗余数据,解决数据文件建立中的人为误差以及数据文件中一些对统计分析结果影响较大的特殊数值,常用的方法包括可编码式清理和联列式清理。数据转换是通过转换工具建立中间表,把不同格式、不同类型的数据转换成系统能够识别的格式。数据分析就是通过分类、估值、预测、聚集、描述和可视化等方法对大量的数据进行处理,从中提取辅助决策的关键知识。知識表示是将数据挖掘的结果以人们能识别和理解的形式呈现给用户,供其使用。 三、大数据推动审计的技术革新 随着大数据和大数据技术的产生和应用,大数据必然对审计技术进行深入渗透和影响,推动审计技术革新和审计方式转变,以适应现代社会对审计的本质需求。 (一)大数据对审计的影响 1.对审计范围的影响。传统审计方式下,由于审计机关受审计力量、审计技术、时间、地点的限制,难以获取审计对象的全部数据,特别是外部数据,所以制定审计计划时,要确立审计重点和规定重要性水平,实行抽样审计。即选取部分样本量估计总体特征,从而缩小审计范围。随着大数据的实时数据采集技术、智能数据分析技术在审计中的应用,最终会抛弃传统的受制于工作量的抽样审计,转而着眼于全量数据,甚至延伸到外部的关联数据, 实现被审计单位数据信息的全面覆盖,大大扩展了审计范围。 2.对审计技术的影响。在传统审计中,审计技术主要表现为现场手工审计技术。审计人员常常不得不亲自前往被审计单位获取并查看库存被审计单位的会计账簿和原始凭证等审计证据,再通过审阅法、查询法、函证、重新计算、重新执行、分析程序等方法来分析审计数据,从而得出审计结论。在大数据环境下,数据的形式、数量、结构都发生了巨大的变化,数据电子化、海量化、半结构化和非结构化的存在,已经远远超越了传统数据库的管理边界,许多传统的审计技术和方法显得效率低下和无法实施,必须使用新的大数据收集、存储、处理和分析方法。围绕大数据,一批新兴的数据挖掘、数据存储、数据处理与分析技术将不断涌现。 3.对审计流程的影响。传统的审计基本都是事后审计或周期性审计。审计流程是:进驻被审计单位→现场取数→数据分析→查找疑点→疑点求证→分析评价→得出结论。这种审计过程耗费大量的人力、时间和精力,审计效率低下,且这种相对滞后的审计模式影响了审计工作的及时性,严重削弱了审计可以达到的预防效果和监督效果。而在大数据环境下,审计主体与被审计单位可以通过联网建立数据接口,实时、持续采集被审计单位数据信息并传输汇总到大数据中心,不需要实施审计时单独去被审计单位采集数据,这样,审计流程起点就由数据采集转变到数据分析。且在大数据协同审计模式下,多个审计项目可以通过数据中心的智能软件同时进行自动分析,然后审计人员对审计疑点进行分散查证,传统的单个项目的独立处理流程就变成了多个项目协同进行的协同处理流程,实现了审计模式由阶段性向持续性转变。 4.对审计风险的影响。传统的审计风险主要来自于审计师的主观职业判断偏差造成的认识风险,审计人员根据预设的风险评估程序以及先验的假设来进行风险评估,确定审计风险的高低和可接受水平。如果当审计证据取得范围受到限制时,审计人员发表的审计结论就可能失当,从而加大审计风险。再者,抽样审计降低了审计结果的精准性,也增加了审计人员发表不当结论的风险。在大数据环境下的全量审计,审计人员不再局限于抽样审计,而是将审计范围扩大到以前因为人员力量和技术力量限制无法取得的证据,使审计样本更大、证据更充分,以减少抽样审计以点到面估计的不确定性,从而降低审计风险。但是另一方面,大数据环境下的数据开放性也带来了数据被未知用户访问和篡改的风险。审计风险的重点也从数据收集阶段转移到数据传输与存储阶段,数据安全风险加大。 (二)大数据推动审计的技术革新 随着大数据和大数据技术对审计的影响和推动作用,传统的事后审计抽样分析、单一审计主体独立作战的审计模式显露出越来越多的弊端,必然催生审计向整体分析、宏观分析、分工协作等方面转变,审计技术、审计方式呈现新特征。 1.数据收集:从抽样审计到全量审计的转变。传统审计方式下,由于审计机关受审计力量、时间、地点的限制,难以对审计数据进行全面的对比分析,往往采取抽样审计方式选取部分样本量估计总体特征,这就是传统审计方式下的抽样审计。抽样审计的结果虽然也具有一定的代表性,但样本规模毕竟只是审计对象的一部分,必然存在不可避免的风险,对审计结果的准确性造成影响。随着大数据数据采集技术、资源共享技术在审计中的应用,关联数据、外部数据在审计中得到充分利用,使审计范围不再受制于抽样样本,而是着眼于全量数据,从整体的角度进行审计,实现被审计单位数据信息的全面覆盖,审计项目更具全面性、延伸性、整体性,审计结果更具有代表性、准确性。 2.审计分析:从微观分析到宏观分析的转变。传统的审计数据分析,大都以原始凭证为起点,通过检查业务发生过程中的原始资料记录从中发现疑点,寻求突破点,为具体的业务人员提供线索;或者根据举报、审计目标等提出审计需求,分析人员进行有针对性的查询分析。总之,就是从数据的微观、细节入手得到个体性的结论。而在大数据环境下,通过数据获取技术、数据分析技术、资源共享技术能够实现对审计对象的内部数据和外部关联数据的获取和分析,实现对公司自身、行业整体或制度实施效果等宏观层面的了解,进而对部门、行业、国家的制度出台及发展战略做出前瞻性的思考和全局性分析。所以,在大数据的环境下,数据分析工作实现了从点到面、从微观到宏观的转变,从而推动审计职能从服务于公司治理到参与国家治理的转变。 3.工作方式:从"一对一"的孤立审计到"多对一"的协同审计转变。传统的审计模式是各个审计主体针对各自的审计任务从审计准备到审计实施结果都采取现场"一对一"审计模式。这种审计模式由于时间、地点、人力的限制,使得审计范围受限,难以通过数据库进行数据对比分析,所以审计效率不高,审计质量低下,审计监督效能未能得到有效发挥。大数据环境下,通过建立大数据收集、存储、分析数据平台,利用数据平台的协同性效应,可以有机地把各个相关审计机构联系起来,组成临时的审计项目实施小组,优化利用各个方面的专业人才,共同完成一项审计任务,以此提高审计效率和质量。这样,传统的"一对一"现场审计模式就演变为"多对一"的各个审计机构协同的审计模式。 4.审计模式:从事后审计到事前、事中、事后持续审计的转变。传统的审计模式一般是在被审计主体经济事项完成后进行的,通过审计被审计单位已经完成的账务处理和报表编制的合法合规性、正确性、合理性,来研究分析问题。这种事后审计模式能够达到事后监督和纠正错误的目的,但达不到事前预防和事中管控的效果。大数据环境下的审计,通过事先在被审计单位嵌入审计软件或者通过数据接口与大数据分析中心互联互通,通过嵌入式审计技术分析用户界面的行为特征,识别当前操作中存在的风险,及时防止错误的发生,从而推动审计端口前移,形成事前监控、事中分析、事后检查的三维一体的持续审计模式。 四、大数据环境下的审计流程再造 根据协同工作原理和大数据实时采集技术可以看出,传统的审计流程起点——数据采集不再需要项目实施时单独去采集,在事前审计阶段就已完成;传统的数据分析也不需要审计人员亲历亲为,而是由大数据中心的智能分析承担;审计人员的工作重心不再是凭证检查,而是转移到对审计疑点的分散查证上。且大数据环境下的审计从事前就开始了,是事前、事中、事后的三维一体持续审计过程,审计流程发生了巨大的变化。如下页图所示。 (一)事前监控 事前监控是指在被审计单位的经济业务活动发生之前的一种检测和控制活动。事前监控可以起到预防作用,减少失误,有助于严格执行财经纪律,预防错弊,保证经济活动的合理性、有效性和会计资料的正确性,实现决策的科学化。 事前监控是通过嵌入审计技术来实现的。嵌入审计技术就是通过编写特殊的审计程序嵌入被审计单位的系统中,当业务流经审计程序设定的控制点时,控制阀门就会捕捉该业务流程的映像,从而通过审计程序中事先设定的合理、合法、合规等判断标准评价该业务处理的合理合法性、真实性、正确性和完整性,识别审计风险,生成审计预警,达到事前监控的目的。 在大数据环境下,嵌入审计还可以通过另一种方式来实现,即不需要在被审计系统嵌入审计程序,可以通过大数据处理中心与被审计单位联网建立数据接口,在大数据处理中心端口处嵌入审计程序,被审计数据实时传输到大数据处理中心时,通过数据端口处达到实时监控的目的。 (二)审计分析 在大数据环境下,数据量巨大且并不都是有效的数据,它包含了错误的数据和冗余的数据,如果用传统的人工分析无异于大海捞针。大数据分析通过专业的计算机审计分析软件,利用专业的数据挖掘和数据筛选技术根据算法和标准挖掘和筛选出有用的审计数据,对原始审计数据进行初步的数据清洗,以确定审计分析重点。传统的"一对一"审计模式下,审计机关各自为政,在"信息孤岛"状态下几乎无法获取被审计对象的关联数据。大数据处理平台的关联数据库,跨系统跨平台获取数据的能力实现了这一目标,大数据处理利用数据中心的关联数据库资源或联网获取外部数据资源进行对比分析与数据查询,对财务数据和业务数据进行深入的多角度的关联分析,通过信息(数据)流向追查资金、业务、实物流向,揭示隐藏在数据项之间的关联关系,从而发现存在的异常情况, 在此基础上通过进一步分析,从而发现审计疑点。 (三)分散查证 通过审计分析的异常情况,生成审计疑点并进行疑点汇总,根据协同工作小组的分工原则,对各个审计项目的审计疑点进行专业和技术分类,落实相应的审计人员进行分散核查、逐一证实。再根据查证的结果进行会商,专家评估,得出审计结论。最后根据审计评价和结论加强审计结果的利用。这样,使审计人员从传统审计繁重的审计取数、审计分析等高强度工作中解放了出来,把精力主要放在审计查证上,从而大大减轻了基层审计机构在数据采集和数据分析上耗时耗力的负担,提高了审计效率,保证了审计质量,增强了审计事前监督、事后检查的效能发挥。 五、结语 在大数据环境下,探索大数据对审计的影响和技术革新,推动大数据持续审计建设是当前时代发展的迫切要求,也是审计主体提高审计效率,加强审计质量的内在需求。本文根据大数据的发展对审计的影响分析,论证了大数据技术对审计技术的革新和推动作用,重塑了大数据环境下的审计流程,为我国的大数据审计建设与实施提供了初步的思路。大数据审计是未来审计发展的一种新趋势,加强大数据审计技术的创新和开发是未来研究的重点。而另一方面,审计数据存放在网络中,就会面临被大量访问的安全风险,因此,数据安全也是一个不能忽视的领域。其次,推动大数据环境下审计的法律法规和标准体系建设,也是未来大数据审计发展的关键。Z 【主要参考文献】 [ 1 ] 魏祥健.云平台架构下的协同审计模式研究[J].审计研究,2014,(06). [ 2 ] 彭安鑫,石磊.云计算技术概述[J].网络安全技术与应用,2011,(06). [ 3 ] 宋美霞.大数据背景下数字档案馆信息服务研究[J].档案管理,2015,(03). [ 4 ] 杨刚,杨凯.大数据关键处理技术综述[J].陕西理工学院数学与计算机科学学院,2016,(04). [ 5 ] 吴磊.浙江电信存储云化进行时[J].IT经理世界,2014,(09). [ 6 ] 王娅纷.数据挖掘浅谈[J].电脑知识与技术,2009,(09). [ 7 ] 韩强.大数据环境下的审计模式创新研究[J].创新科技,2015,(06). [ 8 ] 魏祥健.云计算环境下云审计平台架构与实现[J].财会通讯,2015,(04). [ 9 ] 魏祥健.大數据环境下政府审计模式转变[J].财会月刊,2016,(08). 【作者简介】 魏祥健,男,重庆科技学院,教授;研究方向:审计。近年来出版专著一部,主编教材4本,主持国家重点研发、国家社科基金、省部级重点项目等十余项,发表论文四十余篇。