【金融风控-贷款违约预测】数据挖掘学习:2.数据分析目录学习目标内容介绍代码示例总结
学习目标学习如何对数据集整体概况进行分析,包括数据集的基本情况(缺失值,异常值) 学习了解变量间的相互关系、变量与预测值之间的存在关系内容介绍数据总体了解: 读取数据集并了解数据集大小,原始特征维度; 通过info熟悉数据类型; 粗略查看数据集中各特征基本统计量; 缺失值和唯一值: 查看数据缺失值情况 查看唯一值特征情况 深入数据-查看数据类型 类别型数据 数值型数据 离散数值型数据 连续数值型数据 数据间相关关系 特征和特征之间关系