【摘 要】本文结合非寿险精算中普遍存在的具有层次性和相关性的数据结构,在分层模型的全新视角下,充分借鉴分层模型的理论研究成果,对分层模型在非寿险定价与索赔准备金评估中的应用研究的最新成果进行了系统梳理和总结,并将贝叶斯方法、随机模拟、信度理论、数据分析技术、科学计算等融合其中,在此基础上,提出了一些有待深入探索和进一步扩展的新思路,这对提升我国非寿险精算学科的统计分析体系,促进我国非寿险精算学科的发展具有重要的科学研究意义。 【关键词】非寿险;分层模型;贝叶斯方法 一、引言 分层模型是20世纪90年代在国际上形成并正被迅速推广应用的新的统计分析技术。分层模型通过设置自身的概率子模型来确定模型参数的方式,扩展了标准的线性模型、广义线性模型和非线性模型。这些标准模型在进行统计分析时,通常要求观测数据来自独立( 随机) 变量,而在很多精算和统计问题中,更多需要处理纵向数据、空间聚类数据、甚至更一般的聚类数据,这些数据都不满足独立性假设,且具有一定的层次结构。由数据的层次结构,可将数据划分为不同层次的目标组,进而引入分层模型的概念。这种分层建模方式可以将复杂问题分解为相互联系的各个组成部分,为科学研究提供了一种新的分析框架。 在非寿险精算学中,定价与索赔准备金评估是两大核心专题。定价是否充足合理,直接影响到财险公司产品竞争力和公司盈利水平20世纪90年代,英国精算师把GLM引入到非寿险定价中,20年来GLM在很多国家的非寿险定价实务中取得了长足发展。尽管如此,GLM仍存在一定的缺陷,如当某些分类解释变量在某些水平上的数据量很少时,会使得这些水平参数估计的标准误差很大。另外,在这种情况下,直接应用GLM也会面临待估计参数个数过多的问题。为了解决这一问题,精算师试图将信度理论融入到GLM框架中,涌现出了一些统计模型与方法的应用研究,如广义线性混合模型,分层广义线性模型等。作为更一般意义下的分层建模技术,不但为具有相关性和层次结构的非寿险经验数据提供了一种处理大规模分类问题的自然方式,而且HGLM能提供贝叶斯信度建模的统一框架,也很容易将信度理论融入到GLM或非线性建模框架中。这些优势注定了分层建模技术成为当前国际精算理论研究的热点问题。 索赔准备金通常是财险公司资产负债表中份额最大的负债。在确定财险公司的经营业绩和偿付能力方面,都依赖于索赔准备金负债的准确评估,因此合理评估该负债对财险公司意义重大。目前,关于索赔准备金评估的随机性方法研究已经成为非寿险精算热点之一,尤其在采用严格的统计模型与方法度量准备金的波动性,进而模拟准备金的预测分布方面,已经取得了很大进展。在这方面的研究中,针对损失流量三角形( 按事故年和进展年对損失数据整理得到的二维数据表) 建立模型假设,并结合随机模拟方法来得到准备金的预测布。这种主流的评估方法没有体现出流量三角形数据随时间反复观测的纵向特征。分层模型作为分析纵向数据的一种自然方式,可以把损失流量三角形视为分层数据,每个事故年对应的数据可作为一个目标,进而应用分层模型来研究索赔准备金的评估问题,这样不但体现了同一事故年损失数据的纵向特征,以反映组内数据的相关性,而且也考虑了不同事故年由未观测到的特征所导致的异质性,这是一个新的研究思路,有待于深入探索。另外,近年来贝叶斯方法已经成为分层模型中的重要方法之一。如果能把HGLM非线性分层模型与贝叶斯方法结合起来,应用马尔可夫蒙特卡罗随机模拟方法,可以设想这为得到准备金的预测分布提供了另一种思路。最后,在准备金评估中,结合损失进展过程的建模方法,如各种增长曲线模型和光滑模型等,将这些模型纳入分层建模技术中,也可以有效避免尾部进展因子的选定问题,这些问题的深入探索已成为索赔准备金评估的最新研究方向. 二、分层模型 分层模型的基本思想在于: 模型的某些参数本身需要建模,即在分层模型中,一些模型参数不是通过样本数据来估计,而是通过模型的超参数使用极大似然估计或相关的优化技术来估计,这些模型自带的参数有时也称为随机效应; 另外一些参数是通过样本数据直接估计的,这些参数也称为固定效应,从中可以看出,分层模型的核心思想是通过在预测量中引入随机效应,来体现目标组内数据的相关性和不同目标组间的异质性。这一部分将从以下个方面对分层模型的理论进行系统梳理和总结。 (一)从LM到一般化的分层线性模型的理论研究 对于某些不满足独立性并具有层次性的数据结构(如聚类数据、纵向数据),标准的LM不再适合。LM要求观测变量具有独立性,即模型中只含固定效应变量,因而没有考虑数据间的相关性和层次结构。作为推广,在线性混合效应模型中,既含固定效应变量,又含随机效应变量,且随机效应变量服从正态分布。有关随机效应的经典文献可以参考little等。该文献对一些标准统计术语,基于固定效应的估计量和基于随机效应的预测量之间的差异,LME的参数估计方法\模型检验和诊断以及不同LME模型之间拟合效果的比较等进行了系统总结,并使用SAS软件对实施LME的大量数值实例进行了细致讨论。LME的更一般推广是分层线性模型,此时随机效应变量的分布可不局限于正态分布.目前,LME已在社会 学中得到了充分的应用,经典著作为Randernbush和Brky。 汇总这些研究,可以得出从LM到HLM推广具有以下四方面的优势。第一,与LM相比,采用LME和更一般的HLM将会避免模型过度参数化.第二,在LME和HLM中,随机效应参数通过模型的超参数估计,采用信度加权平均来计算。从信度理论的角度讲,标准的LM和按类别分组后的LM都是分层模型的特例,即对应于HLM的随机效应的方差分别趋于0和无穷时的情况。第三,通过仅仅向LM模型中加入附加超参数的方式,分层建模技术潜在地可以实现更好的拟合。第四,分层模型是嵌套模型,可以使用对数似然统计量、赤池信息准则,贝叶斯信息准则等比较不同模型的优劣,权衡模型的复杂性和拟合效果,最终选择合适的模型。 (二)线性分层模型的理论研究 实际中,变量之间也可能存在非线性关系,对于那些不可线性化的非线性模型,以及更适合采用非线性模型来描述的问题,采用一个具体非线性函数形式可以清晰地为这些问题建模。以增长曲线为例,对增长过程的主观判断以及经验有助于确定选择哪一类曲线。二是模型的简洁性。精心挑选的非线性函数,有时能为一个非线性过程建立比含有多个多项式的线性模型更少的参数。同时,非线性分层建模方法也可以避免模型过度参数化。三是对观测样本外数据的有效性。当然,使用一个模型对样本外数据进行外推,始终会面临预测效果不佳的可能。然而,在选定一模型时,非线性分层模型至少提供了根据对具体问题的了解程度进行判断的思路。与一个缺乏简洁性或更多非理论性的曲线拟合方法相比,这样一种方法操作更有效。 值得注意的是,在使用HLM估计参数时不需要设定参数的初始值,而使用非线性分层模型估计参数时则需要设定参数的初始值,不同的初始值会导致模型不一定收敛,或者不能收敛到一个正确的结果.通过快速观察残差图更有助于判断结果是否正确.在大多数情况下,可以通过简单分析方法辅助选择初始值.如在贝叶斯非线性分层模型中,可以参考参数的极大似然估计,选取合适的先验分布来得到参数的后验分布.另外,为了估计模型参数,需要使用MCMC方法模拟完整的后验分布,进而使用每个参数的模拟样本值实施推断。 三、启示和建议 本文在分层模型的全新视角下,结合非寿险精算中普遍存在的具有层次性和相关性的数据结构,探讨了国外非寿险定价与索赔准备金评估的最新研究方向致力于为我国非寿险精算学科建立一套完善一致的统计分析架构。 综上所述,本文面向国际精算理论研究前沿与热点,结合财险公司目前对精算技术的需求,以分层模型的全新视角,充分借鉴分层模型的理论研究成果,对分层模型在非寿险定价与索赔准备金评估中的应用研究的最新成果进行了系统梳理和总结,并提出了一些有待深入探索和进一步扩展的新思路。其中,涉及分层模型对非寿险精算其他专题和技术(如经验费率厘定\信度理论、贝叶斯方法、随机模拟数值方法等)的包含与扩展,这必将深化对非寿险精算诸分支、诸方法的理论研究,提升非寿险精算学科的统计分析体系,促进非寿险精算学科的发展。 【参考文献】 [1] 段白鴿, 张连增.分层模型在非寿险精算学中的应用研究评述[J].统计研究, 2013, 30(5):98-105. [2] 卢志义, 刘乐平.广义线性模型在非寿险精算中的应用及其研究进展[J].统计与信息论坛,2007,22(4):26-31. [3] 孙维伟, 张连增. 基于HLM2的算例分析及其在中国非寿险精算中的思考[J].统计与决策,2016(22):4-8.