python基础笔记(六)_数据清洗及建模
数据特征分析分布分析研究数据的分布特征和分布类型 定量数据 极差 : max - min 通过直方图直接判断分组组数 简单查看数据分布,确定分布组数 一般8-16即可 求出分组区间 pd.cut(x, bins, right) 按照组数对x分组,且返回一个和x同样长度的分组dataframe right:是否包含右边,默认为True 通过groupby查看不同组的数据频率分布 求出目标字段下频率分布的其他统计量 → 频数,频率,累计频率