今年5月,易鑫集团智能数据中心算法模型团队自主研发的“用于召回的汽车金融风控模型”(以下简称“召回模型”),在“首届全球算法最佳实践典范大赛(BPAA)”的众多参赛作品中脱颖而出,成功入围Top100榜单,进入金融算法赛道前二十名。
“BPAA”是由全球人工智能大会组委会主办的年度赛事,进入TOP100的项目基本代表了国内相关领域的高端水平,将有机会获得上海优厚的产业支持条件。“召回模型”能够进入该榜单,意味着易鑫长久以来在汽车金融领域的科技研发和创新探索获得了积极肯定。
告别“一刀切”,“多级漏斗”的精细化风控
“召回模型”是易鑫风控“多级漏斗”体系中的模型组件之一,在精细化评估客户违约风险,发掘潜在客户方面发挥着重要作用。
追求客户增长的同时还要努力降低客户违约风险,这个看似矛盾的需求一直交织在汽车金融业务开展的过程中,两者只能通过企业有效的风控管理达到动态平衡。因此,一家汽车金融企业的风控管理水平,直接关系着业务增长的“质”与“量”。
易鑫算法模型团队在同领导研讨“多级漏斗”模型
“传统风控手段简单直接,仅仅依靠历史业务经验‘一刀切’。”易鑫风险管理部负责人施晴说:“这种‘单漏斗’模式会将大量潜在客户挡在门外,无形中还可能增加交易风险。”数据分析表明,一次评估过程往往不能对客户的风险程度做出精准的预测。对于易鑫而言,要在汽车金融这个竞争激烈的市场盘子中,争取服务更多资质合格的购车用户,就要对公司的风控体系做出更精细化的建设。在风控业务部门协助下,算法团队经过一年的设计检验,终于设计出“多级漏斗”的风控体系。
“多级漏斗”其实是一个客户分层评估结构,它将风控审核分为预审、审核、复审三个环节。在预审阶段,用预审机器人粗框架的排除明显“不合格”的客户;在审核阶段,主审机器人将客户分为“可服务”和“拟拒绝”两种类型;之后,两种类型的客户都会进入复审程序,两个不同“偏好”的机器人会分别对上述两类客户进行评估:“可服务”类型通过“纠错机器人”判断其违约可能性,“拟拒绝”通过“召回机器人”判断其履约可能性。就这样,“多级漏斗”对同一客户进行多重评估,并根据最终得分预测客户的履约行为。
“行业里传统的做法,会直接剔除‘拟拒绝’的客户。而易鑫的评估体系内,我们在定义客户前增加了一层机器人组合的布局,通过算法来预测客户的履约行为。”模型算法组负责人袁芃说:“通过‘多级漏斗’中四个机器人组成的矩阵反复评估,易鑫风控能尽量做到既不错失一个“好”客户,也不让一个高风险客户成为漏网之鱼。”
效果显而易见,易鑫自创的召回模型每月能从“拟拒绝”清单中发掘数百个客户。经过长期的跟踪统计,这批客户的履约表现要高于公司的整体客户水平。
被数据“驯化”的算法模型
“组成‘多级漏斗’的机器人矩阵,其实质是一个个算法模型。模型的形成是被数据‘驯化’的过程。”算法构架工程苏乾负责模型搭建。他介绍说,首先,要从200多万既有客户的700多个特征维度中甄选出300多个特征组成特征库;再根据标签规则,对筛选出的客户样本进行逐一标记,生成训练样本;将训练样本输入机器学习模型进行训练,再通过历史数据进行验证,根据验证结果计算出合理模型。这些模型都需要在多级漏斗体系内反复迭代训练,在相同的验证数据集上进行模拟比对,才能得出最优的模型。
袁芃认为这个过程就像是组建一支军队:筛选出的客户特征就是武器,按照不同的任务类型(标签),将武器装备训练成相应的兵种(模型),多兵种有机结合构建全方位、立体式的战斗矩阵(风控方案)。就像军队作战需要随机应变一样,模型搭配组合也会根据订单情况和公司业务发展规划进行调整。“这样,就构成了易鑫智能化风控管理的‘兵法’”。
易鑫算法模型团队在讨论“召回模型”运行原理
“兵法”的炼成自有难点,其中最关键的两个,一是找到合适的样本,二是对容错的精准控制。
“召回模型是对‘拟拒绝’的客户进行风险评估,需要有这类客户的训练样本来训练模型,而这类样本是没有标签的。”苏乾说,系统历史订单中只有已成交客户的样本标签,如果只使用已成交客户样本来训练模型,会存在样本偏差,无法对全量客户进行精准预测。“就像‘优中选优’只会提高客户审核通过的门槛”。他举了一个例子,班主任要帮成绩差的学生补课,可是他只收集优秀学生的意见,再去给成绩差的学生讲解,只能是无功而返。
对此,苏乾和同事许博在采用算法界通用的拒绝推断技术基础上,创新设计了一套“A&B表”的样本反复轮番训练法。这个方式是将成交客户不良标签的统计表A和“拟拒绝”客户相应标签的统计表B,按照算法生成新的统计表A1,再把统计表A1和统计表B用算法再次得出A2、A3……到An,如此循环往复以纠正偏差,最终根据各个版本A表的模拟测试结果,得出最优方案。
容错控制则更为曲折。团队最开始采用逾期率控制的方式倒推可容错的客户量,试行后发现精确度不够;后来经过反复测试,决定采用定量成交后的样本观测法,这才得到了想要的效果。”
“制定一个算法逻辑只是数学公式,验证数学公式则需要大量的案例。” 易鑫技术副总裁张磊说:“易鑫‘智能数仓’将客户履约行为,通过加密脱敏处理成标准样本,为优化模型提供了最好的训练素材。”
VESTA模型训练平台,人人皆可参与
传统模型构建方法有技术门槛,只能由专业从事算法的技术工程师操作。过去,团队经常收到业务端一些特殊的标签要求,比如“毕业院校”、“主修专业”等特征加到模型里。“之前觉得没意义,但离客户最近的是业务人员,他们真实了解每一个标签的意义,采纳他们意见建立的特征库就会更鲜活。”苏乾说。
一个大胆的想法由此萌发:构建一个低门槛的平台,让不懂算法的业务人员参与进来,一起在实操中训练模型。VESTA正是在这个环境中诞生的开放平台。在VESTA,一个完全不懂算法知识的业务人员,通过简单的操作培训,就可以构建训练模型。易鑫风控策略部的陈庆玲是第一个吃螃蟹的人。“之前,我们担心将一个变量审核通过率提高会增大风险,通过实际结果观察发现是没有问题的。”她在VESTA平台上将模型和策略结合使用,针对不同客户、业务添加有效变量,通过模型数据的跟踪分析,成功地验证了提升某变量5个百分点的合理性,并最终应用到了模型中。
在袁芃的设想中,VESTA平台可以简化训练模型的复杂程度,吸收更多的业务人员加入到模型训练中。由此,可充分发挥业务人员的优势,深入结合业务经验与算法模型,快速将算法模型渗透到业务各个环节中,从而实现更精准高效的风险控制。
“风险管理是汽车金融业务中的核心关键环节。传统‘一刀切’的经验主义已不能适应业务快速增长的需求。”张磊说:“市场竞争加剧,在服务更多客户和保证资产质量的双重要求下,技术探索还会继续。用算法技术武装业务工具,是个不可逆转的趋势。”
据悉,作为易鑫用科技化手段重构汽车金融业务的一个“代表作”,“召回模型”已经在申请专利。未来,这家专业的汽车金融交易平台还在继续探索更多的业务应用方案,努力朝着业务全智能化的方向迈进。