快生活 - 生活常识大全

基于大数据视角的财务分析研究


  【摘要】  信息化、互联网、物联网的发展推动了大数据时代的到来。大数据时代信息技术发展的巨大变革深刻影响着社会发展的方方面面,同样也对财务分析产生了积极影响。文章通过对大数据及其对财务分析的影响进行研究,提出了相应的应对策略,以期对财务分析工作提供借鉴和思考。
  【关键词】   大数据;财务分析;数据挖掘
  【中图分类号】  F232  【文献标识码】  A  【文章编号】  1002-5812(2020)10-0106-03
  财务分析在企业管理中的作用至关重要,为企业经营提供了决策依据,为改善企业管理提供了支持。财务分析具有完整的理论体系和专门的技术方法。大数据势必会对财务分析产生影响,对财务分析人员提出新的要求和挑战。
  一、大数据的特点、产生和大数据技术
  (一)大数据的特点。大数据(Big Data)是需要采用新的处理方法和工具才能高效收集、处理、储存和分析的信息资产,具有"5V"的特点。Velocity是指数据被生成、收集和处理的速度极快。Volume是指数据量宏大,对传统的数据储存、分析和统计推断等带来了巨大挑战。Value是指数据集的价值极高,但是价值密度极低。Variety是指数据种类极多,包括文本、语音、图片、视频、数值等。Veracity是指数据的可靠性,因数据的来源极多,数据的质量可能良莠不齐,因此,需要关注数据集在生成的过程中有没有统计偏倚、数据集是否有缺失值等问题。
  (二)大数据的产生。随着人类社会信息化进程的加快和对互联网依赖性的增加,人类在日常生产和生活中都会产生大量数据,如社交媒体(如点赞、评论、转载和视频上传等)、交易系统(包括网购记录、单据和收件回条等)、政务系统、办公系统、自动化系统、财务系统等。近年来,物联网的发展更是推动了数据量的跃升。物联网中的温度感知器、湿度感知器、压力传感器等感知器以及视频监控器,每时每刻都会自动产生大量数据,促使人类社会迅速进入大数据时代。
  (三)大数据技术。大数据技术是指伴随着大数据的采集、存储、分析和应用的相关技术,是使用非传统工具对大量的结构化、半结构化和非结构化数据进行处理,从而获得分析和预测结果的一系列数据处理和分析技术。当下最受欢迎的基础技术包括数据采集、数据预处理(包括缺失值处理等)、分布式存储(Apache Hadoop)、NOSQL(Not Only SQL)数据库、数据仓库、机器学习(各类计算统计学算法)、并行计算(Apache Spark,MapReduce等)、数据可视化(包括制图)等各种范畴和不同层面的技术。Python语言的Pandas(数据结构与處理)、NumPy(高性能计算)、Scikit-learn(回归问题、聚类分析问题)、TensorFlow(深度学习、规律寻找)、Pytorch(深度学习、人工智能)、Matplotlib(绘图)等库是相当实用的工具;而且,Python还可以兼容Hadoop MapReduce,使得解决复杂的大数据问题变得轻松。其他受欢迎的工具还包括R语言(dplyr,ggplot2)和MATLAB等。
  (四)大数据的工作流程。
  1.数据预处理。在现实生活中,刚刚获取的数据集往往是不完整的:一是表格中数据缺失(Missing Value),如有一些单元格中的数据为空。二是未正确标注种类数据(Categorical/Ordinal Data),例如一张调查问卷中的某一个问题给出的满意程度为1—5,而回答5的人的满意程度显然不是回答1的人的5倍,这种情况下进行机器学习会导致模型产生统计偏倚。三是数据集的值有错误,例如在年龄一栏录入了负数等。四是数据集有重复值(Duplicate),会导致在机器学习过程中赋予同一个解释变量更大的权重,从而"稀释"了其他潜在的重要解释变量被发现的可能性。这些不完整、不一致、不正确的数据常常会导致错误的结论,因此,数据科学家在获取一个数据集后,通常需要进行大量的数据预处理。其中,处理数据集中的缺失值通常是数据预处理的一个重要环节,常用的有三种方法:弃用、键入、标示。
  弃用的方法最为简单直观。如果一个解释变量(列)中有较少的随机缺失值(没有规律的,因为值缺失的规律也是可关注点之一),则可以考虑弃用有缺失值的观测值(排)。如果一个解释变量中有过多的随机缺失值,那么可以考虑删除该解释变量。
  删除和弃用不可避免地会导致信息的丢失,因此,数据科学家可以采用在有缺失值的单元格中键入一个插入值的方法。插入值的选择方法有很多种:第一种方法也是最朴素的方法是插入统计学中的平均值、中值等。通常来说,在正态(无偏态)的数据集中键入平均值表现良好,在有偏态的数据集中键入中值更加稳健(Robust),因为中值不容易受到离群值的影响。第二种方法是(线性)回归插值。这种方法是将缺失值设为反应变量,将其他现有数据设为解释变量,然后通过拟合的回归模型,用已有的数据来预测缺失值。第三种方法是热卡法,也就是将缺失值替换成相似的观测中的值。常用的方法有将数据按照某些特定属性进行分层后键入缺失值、kNN(k最邻近算法)等。
  标示法比简单的删除法和弃用法损失的信息少,但是在键入缺失值时,信息也不可避免地会有所损失。因此,将缺失值单独标示出来,可以获得值为什么缺失的规律,这也是使用标示法的初衷。例如,可以考虑将所有缺失值替换成一个值(比如0)来代表缺失,然后在绘制概率分布和计算统计数值时将其忽略。对于分类数据,则可以多加一类"缺失"来代表单元格中存在的缺失值。
  2.机器学习。通常来说,如果完成了数据预处理,数据分析就完成了一大半。在处理大数据问题时,在尝试复杂模型和方法之前,应该先尝试线性回归、逻辑回归(通常用于分类问题,本质还是回归算法)、决策树等这些基础模型,将其作为基线,以避免先试用繁琐的方法却没能带来更好的结果。
  由于模型越来越多,模型的选择也变得越来越困难;如果选择的模型不够好,就需要重新选择模型和训练模型,尤其是在处理大数据问题上,往往需要相当的时间和精力。如果用很少的尝试就选出合适的模型,就可以省下很多时间;尤其是对于重要的规律来说,如果能够尽早发现可能会给公司带来更多价值。只不过,数据科学家只有经过不停试错、反复尝试,才能获得选出合适模型的能力。
  3.统计推断。统计推断和得出结论是最为重要的一个步骤,但通常来说这个步骤比较简单。在拟合模型后,可以使用极大似然估计(MLE)和检验统计量来做假设检验;也可以通过检验统计量的分布来做假设下的置信区间。因为大部分检验统计量都是现成的,做统计推断不仅需要统计学和数据科学的知识,常识和专业知识也是非常重要的,因此,数据科学家可以与专业人士合作,共同理解模型得出的结果。
  (五)大数据分析的局限性。值得注意的是,统计推断只能得出证据来拒绝一个假设,而不能得出证据来证明一个假设。而且,得出的证据是统计显著性,统计显著性代表相关性,不能直接用来证明因果关系。因此,在需要证明因果关系的情况下,经过合理设计的实验的数据分析可能比大数据分析的价值更高。
  二、大数据对财务分析的影响
  大数据具有数据量大、数据类型多样、产生迅速、价值高但密度低的特征,本文试分析其对财务分析的数据来源、分析方法、分析内容、分析结果等方面产生的影响。
  (一)数据来源方面的影响。传统的财务分析数据主要来源于内部财务账表以货币计量的结构化数据。大数据时代,财务分析数据的来源除了内部财务账表以货币计量的结构化数据外,还有各类非结构化数据、业务数据等,并且可用的外部数据也越来越多。
  (二)分析方法方面的影响。财务分析的方法有很多种,主要包括趋势分析法、比率分析法、因素分析法。传统财务分析以企业内部数据对比分析(纵向对比分析)为主,横向对比分析由于可取的外部数据受限而较少采用。在大数据时代,由于大数据处理方法的应用,尤其是数据挖掘技术、爬虫技术等,使得获取外部数据变得容易,因而横向对比分析也变得更为容易。
  传统财务分析偏重于因果分析,遵循从结果到原因的分析思路。比如,对于利润变化,通常会从利润变化了这一结果查找原因,如收入、成本、费用等是否发生变化,如图1所示。
  大数据时代的财务分析偏重于相关分析,即从某一相关事务的变化去分析另一相关事务是否发生变化,如没有变化或者变化不合常规,再分析其影响因素,以解释没有变化或者变化不合常规是否合理。比如,由于收入变化了,因此分析利润是否发生变化,如果利润没有变化或者变化不合常规,那么再分析成本、费用是否发生变化,并通过分析成本、费用变化是否合理来判断利润没有变化或变化不合常规是否合理,如下页图2所示。
  传统财务分析以事后分析为主,往往是对已经报账、记账的财务数据,即已经发生的财务数据进行分析,不能对未报账、未记账或者事前、事中即将发生的财务数据进行分析。大数据时代,因为数据分析以相关性为主,财务分析将以过程分析为主、结果分析为辅。
  (三)分析结果方面的影响。传统的财务分析一般限于对表层原因的分析,对于更深层次的原因,由于数据来源的限制,较少涉及。比如,本期销售收入减少了,传统财务分析仅限于分析销量是否减少或单价是否降低,对于质量、口碑、消费者变化以及供求变化等深层次原因,由于数据来源的限制,一般不做分析。比如,传统财务分析可能会得出本期维修费用增加是造成本期成本升高的原因,而对于维修费增加的直接原因一般不做分析。
  在大數据时代,财务分析不仅可以分析出表层原因,还可以追踪分析到深层次原因。如对于本期销售收入的减少,不仅可以分析出销量是否减少或者单价是否降低,还可以分析出对某某客户销售量的减少,是否为质量变差、口碑不好、消费者爱好发生变化等深层次原因。而对于成本增加的原因,不仅可以分析出是维修费的增加,还可以分析出是因为哪台机器损坏、机器的哪个部位损坏以及操作不当、新员工培训不到位等深层次原因。
  大数据时代,尤其是5G时代的到来,数据的传输速度越来越快,获得及时性数据的可能性更大,可用数据更多,因此更能分析出深层次原因。财务分析的结果将更准确、更可靠、更及时、更相关,更有利于解决问题,从而更好地满足决策需求和管理需要。
  (四)会计监督方面的影响。会计的职责,一是财务核算,二是财务监督。一名优秀的财务工作者,除了要做好会计核算工作,更要做好财务监督工作。大数据时代,偏重于相关性和过程性财务分析思维,更能从相关事务中发现另一相关事务的异常情况,从而发现舞弊、贪污等问题。比如,某期报销的机器维修费较高,通过大数据分析发现该期的机器运转率或者耗电量却正常,说明极有可能存在舞弊、贪污等问题。
  (五)分析人员方面的影响。大数据时代给财务分析人员提供了很多工具和方法,但是如果不能灵活使用这些工具和方法,财务分析人员很难有效利用这些大数据集。因此,财务分析人员应当通过不断学习来掌握这些技能,分析思维应从因果型转向相关型。此外,随着财务业务一体化的普及,自动记账和自动生成会计报表已经实现,会计传统的记账、出报表等工作逐步被计算机所取代,管理型、复合型会计人才将变得越来越重要。这就要求财务分析人员转变观念,加强学习,掌握大数据财务分析技能。
  三、大数据时代做好财务分析工作的应对策略
  (一)提高财务分析人员的素质。大数据时代,财务分析人员将面临数据容量大、种类多、价值密度低等问题。在短时间内依靠传统方法发现数据之间的关系和有价值的信息变得越来越困难,这就要求财务分析人员提高素质,不断加强学习能力,掌握大数据的处理方法和思维,提高财务分析报告的质量,更好地为决策和管理服务。
  (二)建立智能化的财务分析体系。大量的低价值密度数据,依靠人工收集、处理、分析变得很困难。因此,财务分析人员可以通过创新型数据处理技术和方法,建立起自动收集、处理、分析数据的智能化财务分析体系。该体系应具有以下特点:一是能够采用爬虫技术等自动收集、整理、处理和存贮数据。二是能够自动分析数据变化的深层次原因,能够帮助财务分析人员找到解决问题的办法。三是能够自动生成满足各类人需要的直观的、准确的分析报告。四是能够对各种财务风险进行自动预警,从而帮助决策人员做出正确决策。
  (三)转变财务分析思维和方法。大数据影响了财务分析的思维和方法。在大数据时代,为了更好地使用大数据这种高价值的新型资产,财务分析思维应从因果型转向相关型,从偏重于结果分析转向过程分析,从核算型会计思维转向管理型会计思维。
  四、结论
  互联网、物联网、信息技术的发展,造就了大数据时代。大数据丰富了财务分析的数据来源,影响了财务分析思维、方法、结果和人员。财务分析人员应加强学习能力,掌握大数据的处理技术和方法,转变财务分析的思维和方法,提高自身素质,满足大数据时代的需要,更好地为决策和管理服务。
  【主要参考文献】
  [1] Gartner.www.gartner.com/en/information-technology/glossary/big-data.
  [2] World Internet Users Statistics and 2019 World Population Stats(0AD).www.internetworldstats.com/stats.htm.
  [3] 文慧娇.基于价值功能的财务分析框架构建的思考——以水务企业为例[J].商业会计,2017,(05).
  [4] 林洁莹.大数据时代背景下会计财务分析研究[J].济南职业学院学报,2015,(12).
网站目录投稿:雁梅