对pandas 数据进行数据打乱并选取训练机与测试机集
描述在机器学习中,拿到一堆训练数据一般会需要将数据切分成训练集和测试集,或者切分成训练集、交叉验证集和测试集,为了避免切分之后的数据集在特征分布上出现偏倚,我们需要先将数据打乱,使数据随机排序,然后在进行切分。需要用的方法如下:注:df代表一个pd.DataFramedf = df.sample(frac=1.0): 按100%的比例抽样即达到打乱数据的效果df = df.reset_i...