3月27日,对于美国圣母大学终身助理教授李俊来说,是个特殊的日子——加入了为中国80%中小银行提供风控服务的百融金服,出任该公司人工智能金融实验室首席科学家,一起打造AI金融实验室。 李俊师从Lasso算法的创始人Robert Tibshirani教授,这个Lasso算法是一种能够实现指标集合精简的估计方法,能够帮助百融金服在预测上更加精准和合理。 百融金服首席科学家李俊 百融金服CRO兼人工智能金融实验室负责人季元透露,目前百融已经有近700位大数据、金融精英在做风控、AI相关的技术研发,因为这是未来百融服务中国数百家银行的基础: 在过去,一位客户来银行贷款,大多数银行在风控系统中跑一圈,会给回一个答案:能贷,或者不能贷。但是在实施人工智能的方案后,风控系统会根据各种海量碎片式的信息来判断,这个用户是暂时的资金困难,还是财务状况发生了根本性的转变——能贷,那么贷多少钱是金额最高、最合理且风险是最低的。 换句话说,AI能够更好地帮助金融机构提升金融服务的智能化、个性化水平——因为全国每天几千家金融机构、数百万笔的贷款申请都要在百融金服的风控体系中"过滤",没有任何一个机构、能够有能力去全部人工"看清"每个用户,因此,百融金服的这个AI金融实验室,将是该公司未来提供贷款风控服务的核心竞争力。 起点:百分点 百融金服的能力有多大? 举个例子,如果有人在若同一设备上多次申请贷款,他可能是无法通过百融金服的反欺诈系统的——这种行为特征已经存在欺诈嫌疑;甚至在同一设备上既申请信用卡又申请现金贷,也一样会被百融认为存在欺诈嫌疑;更有甚者,就算一位申请人填写地址与实际居住地址差距非常远,他也会被判定为存在欺诈嫌疑……是的,在反欺诈上这件事上,百融金服的能力外界很难想象——这都是基于长时间的大数据积累。 2014年之前,百融金服还只是DMP公司"百分点"的一个金融事业部,服务于金融机构,为他们提供风控服务。 什么是DMP呢——互联网广告 DMP(Data Management Platform),就是需求方平台。简单地说,就是建立一个用户画像的大数据库,给一个用户建立无数标签:例如PL0001这个用户看过汽车广告、香烟广告、点过淘宝上的口红……等等,各种网络行为都化为一种标签成为这个用户的特征。 百融金服CRO兼人工智能金融实验室负责人季元透露,目前百融金服的数据库里,单一个人能有10到50万个标签(当然不是每个标签都有数值)。 最早受Double click影响,大数据技术用来服务广告主来识别某个人适不适合自己的广告,即要不要付费给媒体平台让它给这个人推送自己的广告。这就决定了,当年的百分点在互联网PC时代就已经积累了大量中国网民的信息特征(注意,这与隐私无关,因为是经过双重加密的)。 今天来看,这个能力已经成了各种网络业务的核心,基于用户画像能够产生无数个性化服务,例如今日头条的个性化新闻推荐,电商淘宝的千人千面首页,等等,所有有针对性的服务都需要以用户画像为基础。 而今天的百融金服已经凭借自己的大数据能力找到了比广告市场更高端的场景:金融。 银行解决方案是百融金服的重点——从线上线下的营销到反欺诈,从风险评估到价值增值(挖掘有分期付款及透支习惯的客户特点,把存量客户价值最大化),甚至失联催收,百融金服已经参与到了银行服务的诸多环节。 这个时候,百融金服当年DMP的看家本领就有了用武之地:例如在百融金服的营销运作下,峰值时每天可以为某小贷公司撮合放款超过2千万。 也是由于百融金服的大数据信息标签足够全面和精准,其线上发卡量提升了2.3倍。 再举个例子,某行"现金分期"项目,在百融"用户特征筛选"系统的支持下,"现金分期"客户的转化率从2%提升到14%,目标客户转化率提升了700%。 正是这些能力,其实不仅仅是银行,也是小贷公司、P2P公司以及保险公司急需的能力。这让百融金服目前已经与3000多家金融机构有了合作,覆盖了金融行业80%客户。 这些能力的形成,也让百融金服获得了资本市场的青睐。 聪明的大脑 "我之所以加入百融金服,是因为他们的数据量实在是太大了,这对于AI模型来说是最肥沃的‘土壤’!"李俊称。作为美国圣母大学(2017年US News全美大学综合排名第十五名)应用与计算数学与统计系,被破格提前授予终身教授并晋升为副教授的科学家,李俊正试图将国外先进的技术应用于国内——当然,要加以改良。 对于百融金服来讲,AI技术之所以重要,就是因为它能够用计算机算法从海量碎片的数据中挖掘出不同层次的信息。 AI能够判断一个人的财务状况是否发生了恶化:原本开劳斯莱斯,结果这位用户把车卖了,买了个夏利……当然,AI不会仅仅凭借这一个行为就做出论断,而是综合无数碎片化的信息,从而将2000个标签合成10个高一层次的标签(数字为举例),再不停地做出更高层次判断的标签,例如一个人是不是"靠谱"。 而这些都必须AI来做——因为类似"靠谱不靠谱"这样的高层次标签需要AI这种丝毫不带感情、价值观色彩的"评估者"来计算。 事实上,这套系统的核心并不是将所有风险拒之门外。风险的度要适度把控才是这套系统的关键。例如对于缺失信息(missing data),系统会自动给出一个低一度的判断值。对于那些基本面很好的用户,不能让他们因为暂时的周转不灵而失去贷款机会。 此次李俊加盟的人工智能金融实验室,就是试图通过"数据+算力+算法+场景"的叠加效应,帮助信贷、保险、理财等金融行业企业更好地决策,过程更加智能化。 未来:数据生态 在季元看来,百融金服的数据已经形成了壁垒——有数据的公司很多,但是并不是都能做风控,以及贷后的催收、营销等服务。 事实上,百融金服的数据也在这些年同步在积累,该公司业务发展过程中衍生的数据,又变成其自身的数据来源,可以基于它开发更多的产品。就百融的数据生态来看,正在越来越大。 举几个例子:能够"长"出来的业务,包括贷后催收,以及供应链金融等等。 先说说反欺诈。 百融金服最大的优势是有跨机构的视角,每个人都是一个节点,节点之间是有关系的,基于这张上亿节点的图做的图计算,能够进行团体欺诈识别的。 季元透露,团体欺诈有个很明显的特征,一伙人在短时间内会在多家金融机构申请贷款,通过基于AI的图计算很快就能把这些特征抓出来——在金融领域,这是一个比较典型的AI应用场景。 还有就是自然语言识别,百融金服今年正准备将一个产品配上AI,就是通过NLP(自然语言处理)能力解决电话客服的问题。例如在贷前审核阶段,传统金融机构会将人工语音审核的过程外包给call center公司,帮自己核实贷款人的真实性。 百融金服可以通过AI来做。例如AI问用户一个问题,用户回答,AI来判断用户的回答对不对。还有就是在催收环节,过去是通过人打电话去催他还款——AI也是这样,告诉贷款人欠了多少钱,问什么时候应该还,如果用户回答说"没钱"或者"有钱",下一步再告诉用户怎么还款,不还款会有什么后果。 这些通过AI来做就能降低人工成本。以往的call center都是两三千人,未来银行可以直接采购百融金服这种服务。 是的,以人工智能和大数据为基础的百融金服正在围绕自己的核心竞争力迅速成长,百融金服的征途才刚刚开始。