概述
机器学习(1)
knn,手写代码实现
from sklearn import datasets
from collections import Counter
# 为了做投票
from sklearn.model_selection import train_test_split
import numpy as np
# 导入iris数据
iris = datasets.load_iris()
X = iris.data
y = iris.target
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=2003)
def euc_dis(instance1, instance2):
"""
计算两个样本instance1和instance2之间的欧式距离
instance1: 第一个样本, array型
instance2: 第二个样本, array型
"""
# TODO
dist = np.sqrt(sum((instance1 - instance2)**2))#计算两个样本间欧式距离
return dist
def knn_classify(X, y, testInstance, k):
"""
给定一个测试数据testInstance, 通过KNN算法来预测它的标签。
X: 训练数据的特征
y: 训练数据的标签
testInstance: 测试数据,这里假定一个测试数据 array型
k: 选择多少个neighbors?
"""
# TODO
返回testInstance的预测标签 = {0,1,2}
distances = [euc_dis(x, testInstance)for x in X] # 训练集中数据和测试数据进行距离计算
kneighbors = np.argsort(distances)[:k]
#采用argsort返回距离测试数据最近的K个值的索引下标值
count = Counter(y[kneighbors])
#对应的最近的k个值的标签,并将计数结果传递给count
return count.most_common()[0][0]
#输出全部常见个数
# 预测结果。
predictions = [knn_classify(X_train, y_train, data, 3) for data in X_test]
print(predictions)
correct = np.count_nonzero((predictions==y_test)==True)
print ("Accuracy is: %.3f" %(correct/len(X_test)))
最后
以上就是激动可乐为你收集整理的knn,手写代码实现--机器学习(1)的全部内容,希望文章能够帮你解决knn,手写代码实现--机器学习(1)所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复