方俊 秦乐 摘要:在简要分析传统人才评价方法不足的基础上,本文结合电力行业技能人才的特点与大数据技术,介绍了一种基于数据模型的技能人才评价方法。该方法首先对大量原始数据进行模糊化与变量转换,然后用因子分析法构建人才评价指标体系,最后用L-M算法优化后的三层BP神经网络进行模型训练。本研究首次将BP神经网络模型引入电力企业的技能人才评价,相较于其他方法,该评价方法更加客观有效并减少了人才测评成本,是人才评价技术的一种创新。通过对模型进行实例验证,结果表明本研究提出的模型具有较强的预测性,有望为电力企业技能人才的选拔评价提供有效地技术支撑。 关键词:因子分析 神经网络 人才评价 电力企业 一、引言 技能人才是电力企业人才的重要组成部分,科学评价人才是促进人才成长、提升企业人力资源管理水平的关键。长久以来,技术技能人才的评价更多地局限于职称评定、职业技能鉴定和竞赛比武等,随着对评价技术认识的不断深入,传统评价手段暴露出信效度不高、程序复杂、成本高昂等不足。这些一定程度上影响了人才评价的基础性、导向性作用,也制约了人才评价在更大范围、更深层次上的发展和应用。大数据技术的出现为解决上述问题提供了一种可能性。随着互联网、云计算、移动应用等科技的发展,基于大数据的特定领域技术将成为现代大型企业的关注焦点。通过建立有效的数学分析方法,对庞大的、历史的、全面的数据进行有效分析,有望促使人才评价技术不断优化和改善。 总体来看,我国在基于大数据人才评价方面的研究还处于起步阶段。李红光等以层次分析法为基础建立数学模型对人才进行评价(李红光,杨晨,2009);石珊提出以基本素质和工作业绩相结合,现场能力和理论知识相结合的技能人才评价方法(石珊,2013);吕凤军针对技能人才的特点构建指标体系,利用AHP层次分析法对各指标进行了权重的确定进而计算评价等级(吕凤军,2012);邢洁等将遗传算法与BP神经网络相结合构建评价模型取得了一定效果(邢洁,刘芳,2012);张洪燕用熵值法对指标进行筛选然后用结构方程模型的方法对评价指标体系进行实证分析(张洪燕,2012);陈苏超等运用模糊层次分析法对三级评价指标进行筛选,利用模糊神经网络模型对人才进行评价(陈苏超,薛华,2014)。可见,目前在建立人才评价指标体系是对相关数据的利用和挖掘比较有限,聘请相关专家对人才评价指标进行评定增加了成本;在建立评价模型时,多数研究者通过确定各指标权重得出人才评价结果,这种线性模型要求对各指标精确评分,往往只有行业内经验丰富的人力资源专家才能做到(王媛,马小燕,2006)。基于神经网络的评价模型也往往由于原始数据处理不充分或参数不合理导致结果不理想。 本研究充分考虑与技能人才评价相关的数据指标,采用因子分析法进行指标变量构建,充分利用全量数据的特性,挖掘潜在的相关指标,使指标的选择更加客观。然后经过模糊化处理与变量转换,并以L-M优化算法代替梯度下降法进行神经网络的训练,最终得出技能人才的评价结果。 二、评价指标选择 1.数据采集 作为高风险、高投入的技术密集型企业,电力企业对技术技能人才有着较高的要求。要想客观高效地构建技能人才评价指标体系,体现大数据技术在该领域应用的优势,就必须尽可能多地采集相关数据,并通过一定的技术方法找出对人才评价有潜在影响的指标。为了避免遗漏并保证数据采集的系统性,本文将技能人才评价所有相关的数据进行了分类,简要示例见表1。采集的初始数据基本涵盖了对评价结果有影响的因素,从而构建全量数据集。 2.数据预处理 为了便于计算,并符合神经网络的输入要求,这里将字符型变量变换为数值型变量,然后用S(Sigmoid)函数将变量取值映射到[0,1]区间。通过引入模糊语言变量将属性指标进行量化。若为实数域上的模糊集,其三角隶属度函数如下: 缺失值用该变量取值的中位数代替。根据现有的历史数据,每个样本数据均对应于一个评价等级。样本集基本涵盖了以往技能人才评价的全部信息,据此训练出的神经网络模型可最大限度拟合人才评价的非线性过程,从而得到接近最优的评价结果。 3.评价指标的确定 对于技能人才的评价是一项复杂的系统工程,应从多方位、多角度、多层次对其进行考核与评估(李淼淼,2011)。传统的评价体系构建往往是根据层次分析法(AHP)确定各个参与评价的指标。本研究初步建立的评价指标体系主要根据电力行业技能人才定义的内涵及外延采集全量范围的数据,提取变量后用因子分析法确定参与人才评价建模的指标或指标组合。因子分析法把初始变量表示成各个因子的线性组合,可将现有的变量变成少数几个新的变量进入后续的神经网络学习,同时保证新变量几乎带有原来所有变量的信息,从而在有效降维的同时提高了评价模型的客观性与准确度。最终确定的参与模型评价的指标将由数据集决定。 经过因子分析,将能发现原始数据中的共性因子,挖掘潜在的对人才评价有较大影响的指标,并实现有效降维,从而降低了后面神经网络的结构复杂度,一定程度上提高了模型效率与精度。 三、评价模型的建立 1.确定神经网络模型结构 神经网络模型是一种数学方法,其本质是模拟人类实际的神经网络,由大量的神经元按照某种规律连接而成的复杂网络系统(孟倩倩,2015)。技能人才评价是一种典型的非线性过程,神经网络则能有效地拟合这种过程,完成输入到输出的非线性映射。由因子分析法确定的评价指标几乎代表了与技能人才评价相关的全量数据,用S函数处理之后可作为BP神经网络的输入,神经网络的任务是经过训练后,实现对技能人才的评价。其总体结构图如图1所示。为了简化神经网络结构,防止训练时间过长或陷入局部最优并出现过拟合现象,采用多个神经网络分别训练不同类别样本的策略,并采用L-M优化算法代替梯度下降法。 四、实证分析 总体来看,某电力企业人才总量相对充足,但人才结构不够合理,高端技术技能人才相对匮乏。技能人才的结构性失衡一方面说明培养机制有待改善,另一方面,说明评价选拔方法也有待优化。近年来,某电力企业积极探索新模式,尝试新技术的应用,在技能人才评价方面开展了大量工作。根据目前技能人才评价现状,以岗位胜任力为基础,参考表1的思路采集与技能人才评价相关的全量数据。 1.数据预处理 根据第二部分提出的评价指标选择方法,首先将原始数据进行初始指标提取后用模糊化方法进行量化,然后根据公式对指标取值进行计算得到相关矩阵。本文选取了300条数据进行试验,因子分析简要结果如下: 共提取了5个公因子(主成分),其成分矩阵如表2所示。 为了更利于解释所得因子的逻辑意义,增加了因子旋转分析,并生成了旋转空间的成分图,如图2(前三个成分):由此可看出各个初始变量在不同成分变量上的权重。这也从侧面反映了不同变量之间的逻辑关系,如:专业知识得分、素质测评平均和平均作业效率三个变量联系紧密,组成了成分2的主要权重。这种方法一方面筛选了主要变量,另一方面降低了数据维度。在本例中原始数据共27个变量,涵盖了表1中基本数据、考评数据、行为数据等三大部分。因子分析后生成5个主要变量并在每个原始变量上取不同权重值。 2.神经网络训练 因子分析在保留初始指标信息量的同时找出变量间共线性,简化输入指标数量,减小了神经网络的结构复杂性。经过上述步骤的处理,神经网络输入变量为五个,其中每个变量值为各个原始变量的加权,模型实际输出变量为对应的评价等级,由第三部分2中所述方法计算得到,模型的期望输出值对应于数据样本集中每条数据的评价等级。确定输入输出及期望值后,按上述训练过程进行迭代计算。 3.模型评估 为了直观反映模型效果,采用clementine进行仿真计算。经过反复尝试,将该神经网络最优迭代次数设置为950,经过950次的迭代后结束训练。数据评价预测准确率为89.3%,如下图,其中正确预测267例,预测错误32例,且错例中评价等级为中的被错判成差与良各6例;评价等级为良的有9例被错判为中,评价等级为优的全部预测正确。由此说明该模型对正向等级预测效果较为稳定。 下列图示是对模型的性能评估(以评价结果 "中"为例)。F1为信息增益百分比(Gain)图,指的是信息不确定性的减少量。F2为功效点(Lift)图。它是将每个分位点中成功数占记录数的百分比与在训练样本中成功数所占百分比做比较。对于一个好的模型来说:Gains 图将陡峭地升高到100%然后渐渐变得平缓并一直保持下去,而一个较差的模型将从较低的左端以接近斜对角线上升到右端;Lift图描述的是与不利用模型相比,模型的预测能力提升的程度。一个性能较好的模型,其曲线应该从左端高于1.0处开始,能够短暂保持在一个高度稳定的水平上,到图像右端时突然急剧地减小到1.0。性能较差的模型,整个图像中曲线将一直围绕在1.0附近。 具体到本研究中,如果以评价等级"中"为例来对模型的性能进行评估,其中下面两图横坐标均为百分位点,如20百分位,它表示在所有测量数据中,测量值的累计频次达20%。F1纵坐标为信息增益百分比(Gain)。Gain分布的20百分位表示有20%的评价样本数据小于约70%的信息增益,从曲线的整体走势来看,说明信息增益提升非常快,模型区分数据的能力比较强,分类效果明显。F2纵坐标为功效点(Lift)。Lift的走势从左端的4.0处开始,短暂的稳定在3.5左右后急剧减小到1.0。说明与不利用模型相比,本研究的模型预测能力有较大的提升。 整体来说,该机器学习模型较为可靠。相比于传统方法,该评价模型采用因子分析法构建指标体系,模型性能较高,评价结果较准确。 五、结语 本研究在简要分析传统人才评价方法不足的基础上,结合电力行业技能人才的特点与大数据技术,首次将BP神经网络模型引入电力企业的技能人才评价,介绍了一种基于数据模型的技能人才评价方法。该方法以某电力企业为背景,根据技能人才的内涵及特征广泛采集与评价有关的数据并提取指标变量,用因子分析法构建评价指标体系,在最大限度保留全量数据信息的基础上有效精简了建模指标。然后采用L-M优化算法的BP神经网络学习样本数据进而得到技能人才评价模型。解决了经典神经网络评价模型由于原始数据处理不充分或参数不合理导致结果不理想的问题,同时,也解决了传统人才评价方法对相关数据的利用和挖掘比较有限的不足,使人才评价的结果更客观,降低操作成本。当需要对技能人才进行评价的时候,评价指标数据经过处理后输入训练好的模型中即可得到评价结果。相较于传统方法,该评价模型更加准确客观,提升了人才评价工作的效率。有望为今后企业高技能人才的评价、评级提供科学有效的分析手段,具有较强的应用价值与广泛的应用前景 参考文献 [1]李光红,杨晨.高层次人才评价指标体系研究[J].科技进步与对策,2009(4):186-189 [2]石珊.基于AHP法的重庆市高技能人才评价体系研究[J].现代经济信息,2013(2):376-377 [3]李光红,杨晨.高层次人才评价指标体系研究[J].科技进步与对策,2009(4):186-189 [4]吕风军.基于多层面分析的高技能人才评价指标体系构建[J].企业经济,2012(6):56-58 [5]邢洁,刘芳.基于遗传神经网络的天津滨海新区人才竞争力评价[J].科学管理研究,2012,30(4):97-99 [6]张洪燕.基于熵值法和SEM 的高层次外贸人才评价指标体系研究[J].江苏科技大学,2012 [7]陈苏超,薛华.基于模糊神经网络的高层次创新型科技人才的评价[J].太原理工大学学报,2014,45(4):420-424 [8]王媛,马小燕.基于模糊理论与神经网络的人才评价方法[J].佳木斯大学学报(自然科学版),2006(7):439-410 [9]李淼淼.基于模糊神经网络的电力企业核心竞争力评价研究[J].河北工程大学,2011