特征工程之数据预处理中的缺失值处理(使用pandas和sklearn)
原则:1.缺失数据的比例2.数据的重要性方法:如果缺失的数据不重要或者缺失的很多可以直接删除。删除:1.删除所有包含缺失数据的行data=data.dropna(axis=0)2.删除所有包含缺失数据的列data=data.dropna(axis=1)3.删除缺失的某个数据列如:删除a,b列data = data.drop(['a', 'b'], axis=1)如果缺...