day02-Knn、朴素贝叶斯、决策森林和随机森林
一、sklearn数据集skearn库中有自带的小数据集,也有从网下下载的某些数据集API数据集划分训练数据:用于训练,构建模型测试数据:在模型检验时使用,用于评估模型是否有效API: sklearn.model_selection.train_test_splitx_train, x_test, y_train, y_test =train_test_split(x,y,test_size=0.25)注:训练集和测试集数据比例通常是0.75:0.25sklearn数据集接口介绍