概述
在svm模型中测试Iris数据集
摘 要 *本次实验的目的是在svm模型中测试下载下来的Iris dataset,并测试调研Iris数据集上分类精度。用到了Iris数据集的数据,结果测试集测试得到了100%的准确分类精度。
关键词 *svm、iris data set、训练集、测试集。
1 Svm与Iris Data Set
1.1 认识Svm----全称SupportVector Machine
支持向量机(英语:Support Vector Machine,常简称为SVM)是一种监督式学习的方法,可广泛地应用于统计分类以及回归分析。
支持向量机属于一般化线性分类器,也可以被认为是提克洛夫规范化(Tikhonov Regularization)方法的一个特例。这族分类器的特点是他们能够同时最小化经验误差与最大化几何边缘区,因此支持向量机也被称为最大边缘区分类器。
支持向量机建构一个或多个高维(甚至是无限多维)的超平面来分类资料点,这个超平面即为分类边界。直观来说,好的分类边界要距离最近的训练资料点越远越好,因为这样可以减低分类器的泛化误差。在支持向量机中,分类边界与最近的训练资料点之间的距离称为间隔(margin);支持向量机的目标即为找出间隔最大的超平面来作为分类边界。
支持向量机的支持向量指的就是与分类边界距离最近的训练资料点。从支持向量机的最佳化问题可以推导出一个重要性质:支持向量机的分类边界可由支持向量决定,而与其他资料点无关。这也是它们称为“支持向量”的原因。
我们通常希望分类的过程是一个机器学习的过程。这些数据点并不需要是中的点,而可以是任意(统计学符号)中或者(计算机科学符号)的点。我们希望能够把这些点通过一个n-1维的超平面分开,通常这个被称为线性分类器。有很多分类器都符合这个要求,但是我们还希望找到分类最佳的平面,即使得属于两个不同类的数据点间隔最大的那个面,该面亦称为最大间隔超平面。如果能够找到这个面,那么这个分类器就称为最大间隔分类器。
1.2 简述Iris数据集
Iris数据集是一个包含了3个类的数据集,其中每一个类都有50个实例,且每一个类指的是一种鸢尾属植物。这个数据集也许是在模式识别文献中被发现的最著名的数据库。
2 技术报告内容
本次实验的目的是在svm模型中测试下载下来的Iris dataset(其链接:http://archive.ics.uci.edu/ml/machine-learning-databases/iris/iris.data),并测试调研Iris数据集上分类精度。用到的Iris数据集是上述1.2所述的数据,结果测试集测试得到了100%的准确分类精度。下边是两次测试,都是用命令行在Libsvm目录下的windows执行的过程与结果:(trainiris、testiris1、testiris2、testiris3、trainiris_1、testiris_1、testiris_2、testiris_3这些文件都是自己创建,并放入相应的数据)
1).将下载下来的且修改格式后的Iris数据集(一共150条数据)中每一类(共三类,每类50条数据)数据的50%作为训练集,剩下的每一类数据(也是各为50%)分别作为一个测试集进行测试的过程与结果:
a.经过修改格式后的训练集trainiris的数据如下(共有75条数据):(下载Iris data数据集的数据后将其格式修改为右边的格式形式:<label> <index1>:<value1><index2>:<value2> ...最左边的1是代表类别)
1 1:4.9 2:3.0 3:1.4 4:0.2
1 1:4.6 2:3.1 3:1.5 4:0.2
1 1:4.6 2:3.4 3:1.4 4:0.3
1 1:4.9 2:3.1 3:1.5 4:0.1
1 1:5.4 2:3.7 3:1.5 4:0.2
1 1:4.8 2:3.4 3:1.6 4:0.2
1 1:5.8 2:4.0 3:1.2 4:0.2
1 1:5.7 2:4.4 3:1.5 4:0.4
1 1:5.1 2:3.8 3:1.5 4:0.3
1 1:5.4 2:3.4 3:1.7 4:0.2
1 1:5.1 2:3.7 3:1.5 4:0.4
1 1:4.6 2:3.6 3:1.0 4:0.2
1 1:5.1 2:3.3 3:1.7 4:0.5
1 1:4.8 2:3.4 3:1.9 4:0.2
1 1:5.0 2:3.0 3:1.6 4:0.2
1 1:5.2 2:3.4 3:1.4 4:0.2
1 1:4.7 2:3.2 3:1.6 4:0.2
1 1:4.8 2:3.1 3:1.6 4:0.2
1 1:5.5 2:4.2 3:1.4 4:0.2
1 1:5.0 2:3.2 3:1.2 4:0.2
1 1:5.0 2:3.5 3:1.3 4:0.3
1 1:4.4 2:3.2 3:1.3 4:0.2
1 1:4.8 2:3.0 3:1.4 4:0.3
1 1:5.1 2:3.8 3:1.6 4:0.2
1 1:5.3 2:3.7 3:1.5 4:0.2
2 1:7.0 2:3.2 3:4.7 4:1.4
2 1:6.4 2:3.2 3:4.5 4:1.5
2 1:5.7 2:2.8 3:4.5 4:1.3
2 1:6.6 2:2.9 3:4.6 4:1.3
2 1:5.2 2:2.7 3:3.9 4:1.4
2 1:5.0 2:2.0 3:3.5 4:1.0
2 1:5.9 2:3.0 3:4.2 4:1.5
2 1:6.7 2:3.1 3:4.4 4:1.4
2 1:5.8 2:2.7 3:4.1 4:1.0
2 1:6.2 2:2.2 3:4.5 4:1.5
2 1:5.6 2:2.5 3:3.9 4:1.1
2 1:5.9 2:3.2 3:4.8 4:1.8
2 1:6.4 2:2.9 3:4.3 4:1.3
2 1:6.6 2:3.0 3:4.4 4:1.4
2 1:6.7 2:3.0 3:5.0 4:1.7
2 1:6.0 2:2.9 3:4.5 4:1.5
2 1:5.5 2:2.4 3:3.7 4:1.0
2 1:5.8 2:2.7 3:3.9 4:1.2
2 1:6.0 2:2.7 3:5.1 4:1.6
2 1:5.5 2:2.5 3:4.0 4:1.3
2 1:6.1 2:3.0 3:4.6 4:1.4
2 1:5.8 2:2.6 3:4.0 4:1.2
2 1:5.7 2:3.0 3:4.2 4:1.2
2 1:6.2 2:2.9 3:4.3 4:1.3
2 1:5.1 2:2.5 3:3.0 4:1.1
3 1:6.3 2:3.3 3:6.0 4:2.5
3 1:5.8 2:2.7 3:5.1 4:1.9
3 1:7.1 2:3.0 3:5.9 4:2.1
3 1:7.6 2:3.0 3:6.6 4:2.1
3 1:4.9 2:2.5 3:4.5 4:1.7
3 1:7.3 2:2.9 3:6.3 4:1.8
3 1:5.8 2:2.8 3:5.1 4:2.4
3 1:6.4 2:3.2 3:5.3 4:2.3
3 1:6.5 2:3.0 3:5.5 4:1.8
3 1:7.7 2:3.8 3:6.7 4:2.2
3 1:7.7 2:2.6 3:6.9 4:2.3
3 1:6.0 2:2.2 3:5.0 4:1.5
3 1:6.3 2:2.7 3:4.9 4:1.8
3 1:6.7 2:3.3 3:5.7 4:2.1
3 1:7.2 2:3.2 3:6.0 4:1.8
3 1:6.1 2:3.0 3:4.9 4:1.8
3 1:7.7 2:3.0 3:6.1 4:2.3
3 1:6.3 2:3.4 3:5.6 4:2.4
3 1:6.4 2:3.1 3:5.5 4:1.8
3 1:6.7 2:3.1 3:5.6 4:2.4
3 1:6.9 2:3.1 3:5.1 4:2.3
3 1:5.8 2:2.7 3:5.1 4:1.9
3 1:6.7 2:3.3 3:5.7 4:2.5
testiris1、testiris2、testiris3三个测试集的数据如下图三列数据:
b.训练集trainiris经过svm-train生成的模型文件trainiris.mode,该文件生成了三个optimization,如图(进入到libsvm目录下的windows目录,然后输入命令svm-train ../trainiris trainiris.mode)(下面的几个命令窗口输入的命令类似,都是在windows目录下,输入第一行最后的命令)
c.下图是
testiris1、testiris2、testiris3三个测试集经过svm-predict命令得出的三个精度,结果都为100%:
2). 将下载下来的Iris数据集中每一类(共三类)数据的80%作为训练集,剩下的每一类数据分别作为一个测试集进行测试的过程与结果:
a.经过修改格式后的训练集trainiris_1的数据如下(共有120条数据):(其格式为:<label> <index1>:<value1><index2>:<value2> ...)
1 1:4.9 2:3.0 3:1.4 4:0.2
1 1:4.6 2:3.1 3:1.5 4:0.2
1 1:4.6 2:3.4 3:1.4 4:0.3
1 1:4.9 2:3.1 3:1.5 4:0.1
1 1:5.4 2:3.7 3:1.5 4:0.2
1 1:4.8 2:3.4 3:1.6 4:0.2
1 1:5.8 2:4.0 3:1.2 4:0.2
1 1:5.7 2:4.4 3:1.5 4:0.4
1 1:5.1 2:3.8 3:1.5 4:0.3
1 1:5.4 2:3.4 3:1.7 4:0.2
1 1:5.1 2:3.7 3:1.5 4:0.4
1 1:4.6 2:3.6 3:1.0 4:0.2
1 1:5.1 2:3.3 3:1.7 4:0.5
1 1:4.8 2:3.4 3:1.9 4:0.2
1 1:5.0 2:3.0 3:1.6 4:0.2
1 1:5.2 2:3.4 3:1.4 4:0.2
1 1:4.7 2:3.2 3:1.6 4:0.2
1 1:4.8 2:3.1 3:1.6 4:0.2
1 1:5.5 2:4.2 3:1.4 4:0.2
1 1:5.0 2:3.2 3:1.2 4:0.2
1 1:5.0 2:3.5 3:1.3 4:0.3
1 1:4.4 2:3.2 3:1.3 4:0.2
1 1:4.8 2:3.0 3:1.4 4:0.3
1 1:5.1 2:3.8 3:1.6 4:0.2
1 1:5.3 2:3.7 3:1.5 4:0.2
1 1:4.7 2:3.2 3:1.3 4:0.2
1 1:5.0 2:3.6 3:1.4 4:0.2
1 1:5.1 2:3.5 3:1.4 4:0.3
1 1:5.7 2:3.8 3:1.7 4:0.3
1 1:4.9 2:3.1 3:1.5 4:0.1
1 1:4.4 2:3.0 3:1.3 4:0.2
1 1:5.1 2:3.4 3:1.5 4:0.2
1 1:5.1 2:3.8 3:1.9 4:0.4
1 1:4.6 2:3.2 3:1.4 4:0.2
1 1:5.4 2:3.9 3:1.3 4:0.4
1 1:5.5 2:3.5 3:1.3 4:0.2
1 1:4.5 2:2.3 3:1.3 4:0.3
1 1:5.1 2:3.5 3:1.4 4:0.2
1 1:5.4 2:3.4 3:1.5 4:0.4
1 1:5.0 2:3.3 3:1.4 4:0.2
2 1:7.0 2:3.2 3:4.7 4:1.4
2 1:5.5 2:2.3 3:4.0 4:1.3
2 1:6.5 2:2.8 3:4.6 4:1.5
2 1:6.4 2:3.2 3:4.5 4:1.5
2 1:6.8 2:2.8 3:4.8 4:1.4
2 1:5.7 2:2.6 3:3.5 4:1.0
2 1:6.0 2:2.2 3:4.0 4:1.0
2 1:6.1 2:2.9 3:4.7 4:1.4
2 1:5.7 2:2.8 3:4.5 4:1.3
2 1:6.6 2:2.9 3:4.6 4:1.3
2 1:5.6 2:2.9 3:3.6 4:1.3
2 1:6.3 2:2.3 3:4.4 4:1.3
2 1:5.4 2:3.0 3:4.5 4:1.5
2 1:6.1 2:2.8 3:4.7 4:1.2
2 1:5.5 2:2.4 3:3.8 4:1.1
2 1:5.6 2:3.0 3:4.1 4:1.3
2 1:5.5 2:2.6 3:4.4 4:1.2
2 1:5.2 2:2.7 3:3.9 4:1.4
2 1:5.7 2:2.9 3:4.2 4:1.3
2 1:5.7 2:2.8 3:4.1 4:1.3
2 1:5.0 2:2.0 3:3.5 4:1.0
2 1:5.9 2:3.0 3:4.2 4:1.5
2 1:6.7 2:3.1 3:4.4 4:1.4
2 1:5.8 2:2.7 3:4.1 4:1.0
2 1:6.2 2:2.2 3:4.5 4:1.5
2 1:5.6 2:2.5 3:3.9 4:1.1
2 1:5.9 2:3.2 3:4.8 4:1.8
2 1:6.4 2:2.9 3:4.3 4:1.3
2 1:6.6 2:3.0 3:4.4 4:1.4
2 1:6.7 2:3.0 3:5.0 4:1.7
2 1:6.0 2:2.9 3:4.5 4:1.5
2 1:5.5 2:2.4 3:3.7 4:1.0
2 1:5.8 2:2.7 3:3.9 4:1.2
2 1:6.0 2:2.7 3:5.1 4:1.6
2 1:5.5 2:2.5 3:4.0 4:1.3
2 1:6.1 2:3.0 3:4.6 4:1.4
2 1:5.8 2:2.6 3:4.0 4:1.2
2 1:5.7 2:3.0 3:4.2 4:1.2
2 1:6.2 2:2.9 3:4.3 4:1.3
2 1:5.1 2:2.5 3:3.0 4:1.1
3 1:6.3 2:3.3 3:6.0 4:2.5
3 1:5.8 2:2.7 3:5.1 4:1.9
3 1:7.1 2:3.0 3:5.9 4:2.1
3 1:7.6 2:3.0 3:6.6 4:2.1
3 1:4.9 2:2.5 3:4.5 4:1.7
3 1:7.3 2:2.9 3:6.3 4:1.8
3 1:5.8 2:2.8 3:5.1 4:2.4
3 1:6.4 2:3.2 3:5.3 4:2.3
3 1:6.5 2:3.0 3:5.5 4:1.8
3 1:7.7 2:3.8 3:6.7 4:2.2
3 1:7.7 2:2.6 3:6.9 4:2.3
3 1:6.0 2:2.2 3:5.0 4:1.5
3 1:6.3 2:2.7 3:4.9 4:1.8
3 1:6.5 2:3.0 3:5.8 4:2.2
3 1:6.7 2:2.5 3:5.8 4:1.8
3 1:7.2 2:3.6 3:6.1 4:2.5
3 1:6.7 2:3.3 3:5.7 4:2.1
3 1:6.9 2:3.2 3:5.7 4:2.3
3 1:5.6 2:2.8 3:4.9 4:2.0
3 1:7.7 2:2.8 3:6.7 4:2.0
3 1:6.4 2:2.8 3:5.6 4:2.2
3 1:6.3 2:2.8 3:5.1 4:1.5
3 1:6.1 2:2.6 3:5.6 4:1.4
3 1:6.8 2:3.2 3:5.9 4:2.3
3 1:6.9 2:3.1 3:5.4 4:2.1
3 1:6.8 2:3.0 3:5.5 4:2.1
3 1:6.3 2:2.5 3:5.0 4:1.9
3 1:7.9 2:3.8 3:6.4 4:2.0
3 1:6.5 2:3.0 3:5.2 4:2.0
3 1:7.2 2:3.2 3:6.0 4:1.8
3 1:6.1 2:3.0 3:4.9 4:1.8
3 1:7.7 2:3.0 3:6.1 4:2.3
3 1:6.3 2:3.4 3:5.6 4:2.4
3 1:6.4 2:3.1 3:5.5 4:1.8
3 1:6.7 2:3.1 3:5.6 4:2.4
3 1:6.9 2:3.1 3:5.1 4:2.3
3 1:5.8 2:2.7 3:5.1 4:1.9
3 1:6.7 2:3.3 3:5.7 4:2.5
3 1:6.7 2:3.0 3:5.2 4:2.3
3 1:5.9 2:3.0 3:5.1 4:1.8
testiris_1、testiris_2、testiris_3三个测试集的数据依次如下图三列数据:
b.训练集trainiris_1经过svm-train生成的模型文件trainiris_1.mode,该文件生成了三个optimization,如图:
c.下图是testiris_1、testiris_2、testiris_3三个测试集经过svm-predict命令得出的三个精度,结果都为100%:
最后
以上就是开心吐司为你收集整理的在svm模型中测试Iris数据集在svm模型中测试Iris数据集1 Svm与Iris Data Set1.1 认识Svm----全称SupportVector Machine2 技术报告内容的全部内容,希望文章能够帮你解决在svm模型中测试Iris数据集在svm模型中测试Iris数据集1 Svm与Iris Data Set1.1 认识Svm----全称SupportVector Machine2 技术报告内容所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复