k-nearest neighbor(kNN,k近邻算法)理论与实操及KNeighborsClassifier参数详解1. k-NN算法简介2. 实例操作
1. k-NN算法简介k近邻法是基本且简单的分类与回归方法,利用数据集对特征向量空间进行划分,可以进行多分类。如下图:三角形与矩形分别代表两类数据,标签已知。现要对新输入的为分类点(绿色)进行分类,k-NN的做法是寻找与该绿点相邻最近的k个点(k-NN算法的k的含义,图中的距离为欧式距离),然后通过多数表决的方式把绿点划分到这k个最近点出现频数最高的类。例如如果k取3,则绿点最近的3个点中频数最高为三角形类,所以归为三角形类;若k取5,则距离绿点最近的5个点中频数最高为矩形类,所以归绿点为矩形类