我是靠谱客的博主 心灵美魔镜,最近开发中收集的这篇文章主要介绍特征工程-个人信用评估,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

可以用于形成特征矩阵的共有5个表:
1.用户基本属性表
2.银行流水记录表
3.用户浏览行为表
4.信用卡账单记录表
5.放款时间信息表

1.用户基本属性表

字段注释
1用户id整数
2性别枚举值(0表示性别未知)
3职业枚举值
4教育程度枚举值
5婚姻状况枚举值
6户口类型枚举值

1.职业做One-Hot编码
2.教育程度做One-Hot编码
3.婚姻状况做One-Hot编码
4.户口类型做One-Hot编码

2.银行流水记录表

字段注释
1用户id整型
2时间戳整型(0表示未知)
3交易类型枚举值(1表示收入,0表示支出)
4交易金额浮点型
5工资收入标记枚举值(1表示工资收入)

1.时间戳按星期分箱
2.时间戳按月分箱
3.时间戳是否工作日
4.工资收入标记做One-Hot编码
5.交易类型与交易金额做正负数值交易金额字段

3.用户浏览行为表

字段注释
1用户id整型
2时间戳整数(0表示未知)
3浏览行为数据整型
4浏览子行为编号枚举型

1.时间戳按星期分箱
2.时间戳按月分箱
3.时间戳是否工作日
4.浏览子行为做One-Hot编码
5.浏览子行为做统计计数

4.信用卡账单记录表

字段注释
1用户id整型
2账单时间戳整数(0表示未知)
3银行id枚举型
4上期账单金额浮点型
5上期还款金额浮点型
6信用卡额度浮点型
7本期账单余额浮点型
8本期账单最低还款额浮点型
9消费笔数整数
10本期账单金额浮点型
11调整金额浮点型
12循环利息浮点型
13可用金额浮点型
14预借现金额度浮点型
15还款状态枚举值

1.账单时间戳按星期分箱
2.账单时间戳按月分箱
3.账单时间戳是否工作日
4.银行id做One-Hot编码
5.信用卡额度是否低于某个值
6.上期还款金额是否低于某个值
7.上期账单金额是否高于某个值
8.本期账单余额是否高于某个值
9.本期最低还款额是否高于某个值
10.消费笔数是否高于某个值
11.本期账单金额是否高于某个值
12.循环利息是否高于某个值
13.可用金额是否高于某个值
14.预借现金额度是否高于某个值
15.还款状态做One-Hot编码
16.信用卡计数
17.每个用户在不同银行的每张信用卡信用额度的聚合计算,包括最大值、最小值、均值和标准差。

5.放款时间表

字段注释
1用户id整型
2放款时间整数

1 放款时间按星期分箱
2 放款时间按月分箱
3 放款时间是否工作日
4.放款时间期间是否有银行账单或者信用账单突变

6.总结

10345471-58105bb54157eef6.png
特征工程.png

特征工程中的大部分特征可以分为2类:
1.基于时间窗口对连续变量做统计特征,这是特征工程中常用的方法,尤其是对于一个用户对应多条记录的数据表。第一,通过这些统计特征可以提取出用户在某个变量上大致的分布情况;第二,这为特征工程带来大量细分化且包含信息量大的特诊。
2.每个用户在特殊时间点的具体特征值,这些时间点包括最初、最终以及贷款前后,这些时间点所包含的信息量比一般时间点要大,与预测目标值的关联程度也更大。

最后

以上就是心灵美魔镜为你收集整理的特征工程-个人信用评估的全部内容,希望文章能够帮你解决特征工程-个人信用评估所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(269)

评论列表共有 0 条评论

立即
投稿
返回
顶部