关于策略与规则的开发,相信很多在信贷行业做信贷策略的小伙伴们都非常关注。
比如关于以下的场景,你或多或少都一定有遇到过:
公司为了完善线上信贷产品的风控体系,从外部多家三方数据机构引入不同维度的数据源,例如某电商平台的网购黑名单、银联机构的银行卡交易、某设备厂商的APP卸载次数、某网上约车平台的出行系数、非银机构的多头借贷信息、运营商的电话通讯次数、某互金公司的反欺诈等级......
接到这些数据的你,是不是也有些蒙圈。我该如何挑选合适的规则,该如何在最优的成本范围或最有效的程度上,该放置哪些规则优先,选择哪一类最有效的指标放在最前面,以一当百,干掉所有的坏人呢?
这里我们稍微介绍常规上,风控策略分析团队常用的三个方法,分别是:
①单维度标签分布法
②双维度决策矩阵法
③多维度决策树算法
综上一共有这三个方法来解决实施策略规则的挖掘与分析。
本文以第①个方法,单维度标签分布法详细说明,且我们挑选单维度标签法中的评估类的特征为例说明。
举例演示:
①单维度标签分布法
如某变量X10,其代表的含义为:贷前申请信用风险评分(某第三方数据),根据此评估类的指标,我们列出其好坏客群分布情况:
编辑切换为居中
添加图片注释,不超过 140 字(可选)
在以上的综合指标中,我们观察到在(486.855,501.5]这一组别中,其bad_rate(坏账率)、iv(指标显著性)等都明显跟其他组别有差异,于是在第一条的单维核验类规则中,我们制定如下规则:
rule:贷前申请信用风险评分<=501,拒绝
以上特征是属于连续型特征,同样在评估类型的离散型特征中,如该离散型特征X02为:近1年信贷违约账户数
我们也一样可以按照上述思路画出相关的客群分布数据,从而得到新一条的规则rule:
编辑切换为居中
添加图片注释,不超过 140 字(可选)
咱们这里抛个问题,这里具体的规则的拒绝策略中应该选取哪个分段区间最为合适?
当然既然是策略规则的开发,以上提到的这三种开发策略的开发方法跟实操内容跟要点,就势必都会跟大家一一讲解清楚,有兴趣的童鞋可关注《信贷场景多维特征交叉策略的实战分析》:
编辑切换为居中
添加图片注释,不超过 140 字(可选)
课程中,仍是以具体的实操内容为案例讲解,附带具体的数据集:
编辑切换为居中
添加图片注释,不超过 140 字(可选)
编辑切换为居中
添加图片注释,不超过 140 字(可选)
课程中对于有代码基础的童鞋,也会辅助以相关的代码进行自动化的规则策略加工:
编辑切换为居中
添加图片注释,不超过 140 字(可选)
另课程部分预览如下:
编辑切换为居中
添加图片注释,不超过 140 字(可选)
.....(部分内容预览,详见课程)
编辑切换为居中
添加图片注释,不超过 140 字(可选)
......(部分内容预览,详见课程)
...
~原创文章
Copyright © 2024 妖气游戏网 www.17u1u.com All Rights Reserved