概述
1.WOE
:表示自变量在分组内取值对于目标变量(违约概率)的影响
•
WOE
的计算公式是:
•
WOE=
ln
[(
坏样本
/
总坏样本
)/(
好样本
/
总好样本
)]=
ln
[(
坏样本
/
好样本
)/(
总坏样本
/
总好样本
)]
Pyi:是这个组中响应客户(坏样本)占所有样本中所有响应客户的比例
Pni:是这个组中未响应客户(好样本)占样本中所有未响应客户的比例
#yi:是这个组中响应客户的数量
#ni:是这个组中未响应客户的数量
#yT:是样本中所有响应客户(总的坏样本)的数量
#nT:是样本中所有未响应客户(总的好样本)的数
2.IV其作用是消除分组所占比例的影响
,计算公式:
3.KS:
用以评估模型对好、坏客户的判别区分能力,计算累计坏客户与累计好客户百分比的最大差距。
KS值:代表模型的分割样本的能力,不能表示分割的是否准确,即便好坏客户完全分错,K-S值依然可以很高,
通常来讲,KS>0.2即表示模型有较好的预测准确性
KS的计算步骤如下:
•
1.
计算每个评分区间的好坏账户数。
•
2.
计算每个评分区间的累计好账户数占总好账户数比率
(good%)
和累计坏账户数占总坏账户数比率
(bad%)
。
•
3.
计算每个评分区间累计坏账户占比与累计好账户占比差的绝对值(累计
good%-
累计
bad%
),然后对这些绝对值取最大值即得此评分卡的
K-S
值。
4.lift值
Lift曲线衡量的是:与不利用模型相比,模型的预测能力“变好”了多少,lift(提升指数)越大,模型的运行效果越好。实质上它强调的是投入与产出比
先介绍几个相关的指标,以免混淆:
- 准确率(accuracy,ACC):
- 正确率(Precision,PRE),查准率:
- 真阳性率(True Positive Rate,TPR),灵敏度(Sensitivity),召回率(Recall):
- 假阳性率(False Positice Rate,FPR),误诊率( = 1 - 特异度):
5.PSI:群体稳定性指标(popularity stability index),用于衡量模型或特征的稳定性
psi = sum((实际占比-预期占比)* ln(实际占比/预期占比))
<0.1: 稳定性很高,
[0.1,0.25]:稳定性一般,
>0.25: 模型稳定性差,建议重做
最后
以上就是文静棒球为你收集整理的金融风控指标:WOE, IV, KS,LIFT值和PSI的全部内容,希望文章能够帮你解决金融风控指标:WOE, IV, KS,LIFT值和PSI所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复