在信贷行业,风控技术人员 TOP5 头疼事件排行榜上,额度授予模型一定榜上有名;今天我就借这个机会,好好说说额度授予模型。 金大师笔下的江湖暂告一段落,金融风控的修行却永远在路上。 俗话说的好: 产品有三宝:弹窗,浮层加引导。 设计有三宝:透明,阴影加圆角。 运营有三宝:短信,push加红包。技术有一宝,这个做不了。 在信贷行业,风控技术人员TOP5头疼事件排行榜上,额度授予模型一定榜上有名。 今天我就借这个机会,抖抖额度授予模型的宝。 额度授予模型的难度主要来源于模型的验证过程: 1. 验证额度模型需要大量数据 风险预测模型中,模型的输出可以和客户的实际违约情况进行对比,从而一较高下;但是对于额度模型,每一个客户都是独特的,且只有一次被额度授予的机会,所以无法监督哪一个额度模型的表现更好。 2. 验证额度模型需要较长时间 额度模型的好坏,最常用的一把尺子是客户带来的利润,为了观测到客户带来的利润,常常要追踪客户1到2年。在国内瞬息万变的信贷市场,等到这个时候可能黄花菜都凉了。 虽然验证不易,但是在没有足够的数据和验证时间的情况下,还是有一些基本原则可以助我们逆风翻盘: 一、初级阶段 额度矩阵理解起来很简单,就是选取合适的指标区分客群来授予额度。 我们用风险作为唯一决策因子举一个例子: 确定额度范围:通过分析产品想要针对的客群,从而找到一个适当的额度范围。比如说蓝领贷款额度在3000到1万之间;白领的贷款额度在5000到3万之间; 确定风险因子:选择一个评估客户风险程度的指标,比如说使用融慧提供的多头分; 有了上面两步,就可以快速地确定额度授予了(以蓝领为例): 在单因子的基础上加入更多的考虑因子,比如说收入,就可以组成一个更多元的额度矩阵。 这样的额度矩阵非常适合刚刚开始贷款业务的机构,例如如下矩阵: 因为客户自己填写的收入往往难以验证,也可以考虑使用其他的指标代替,比如说居住小区房价、职业、生活习惯等画像类指标代替。这些维度的引入可以使额度矩阵更加复杂,也更加准确。 不过,到哪里去找这些变量呢? 上面提到的风险和客户画像,是融慧金科最擅长的领域;欢迎后台留言垂询。 二、中级阶段 当机构在积累了一定的数据之后,可以通过建模来更科学地进行额度授予。具体的指导思想则是以利润为衡量的标尺,找寻利润最大化的点。 现金贷的利润 = 收入 – 损失 = 贷款金额 x 利率 – 违约金额 在授信额度比较低的时候,额度增高,客户可借款增加,收入增长的速度快。但是当授予额度超过好人可以偿还的范围的时候,好人的额度使用率会下降,导致借款增长缓慢,收入放缓。 与此同时,坏人的额度使用率仍然会维持在100%左右,于是损失迅速增长。模型的目标就是模拟每一个客户的收入和损失,找到使利润一阶导为0,利润最大化的额度;这个就是我们的最优额度。 举一个简单的例子: 我们假设今天是Mate20手机(价值5000元)发售的日子。所有好人的借款目的都是购买Mate20。当授信额度低于5000块,好人一定会取完授信额度。但是当授信额度超过5000块钱以后,好人不会多取。与此同时,坏人一定会取现完所有授信额度。 假设客群的利息为18%,逾期概率为10%,那么: 这个客群的最优的额度授予应该为5000,每位客人的最大利润为 5000 x (0.18-0.1) = 400元。 这个例子看上去是不是特别简单? 但是实际运用中可能牵扯到上百种变量和数十个模型。于是引出了接下来我们要介绍的机器学习模型。 三、高级阶段 我们为什么需要机器学习模型? 原因就在于中级阶段预测利润的模型有两个缺点: 逻辑回归模型不能抓住非线性的关系; 实际运用中,预测利润往往牵扯到数十个模型叠加,所以更新模型十分耗时。 机器学习模型中,KNN模型适合用于额度模型,可以解决逻辑回归模型的以上两个缺点。 KNN模型,也叫最近邻居法,它的思路如下: 给大量客户(客户群体A)随机进行额度授予,并追踪他们的表现; 利用最近邻居法在群体A中找到和申请人B相似的客群子集(子集C); 子集C里面的客户群体因为被随机分配了不同的额度,同时不同的额度带来了不同的客户表现,我们可以直接给申请人B授予子集C中使客户利润最大化的额度。 看到这里,大家一定 敬 (云) 佩 (里) 不 (雾) 已 (里),所以我们特别做了一个图: 从上面的介绍可以看出:KNN模型最大的困难就是积累足够多的随机样本来进行建模。这也呼应了我们一开始提出的额度授予模型的难题。不过基于以上的分享,我相信每个阶段的公司,都可以找到适合自己现阶段发展情况的额度方法,进行额度授予。 以上就是今天的5分钟。 上面的例子看上去简单,但额度模型的构建其实是复杂困难的,不过狮子座属虎的女明星曾经给我们端上一碗鸡汤。