libsvm简单使用

487 阅读 0 评论 322 点赞

我是靠谱客的博主热心蓝天，这篇文章主要介绍libsvm简单使用，现在分享给大家，希望可以做个参考。

最近在学习机器学习中的SVM算法，理论知识已经学的差不多了，现在是使用libsvm工具进行求解的阶段。在网上找了一点资料，然后自己做了个小的总结，希望可以帮到学习libsvm的新手。

一.首先说明一下关于分类问题的流程：训练--->得到model--->分类预测

训练：训练集——〉特征选取——〉训练——〉分类器

分类: 新样本——〉特征选取——〉分类——〉判决

二.libsvm简介：

1.LibSVM是以源代码和可执行文件两种方式给出的。

(1)如果是 Windows系列操作系统，可以直接使用软件包提供的程序（SVMlibsvm-3.20windows，其中有四个可执行程序，svm-predict,svm-scale,svm-toy,svm-train），也可以进行修改编译；

(2)如果是 Unix类系统，必须自己编译，软件包中提供了编译格式文件，个人在SGI工作站(操作系统IRIX6.5)上，使用免费编译器GNU C++3.3编译通过。

2.关于libsvm源码的说明：

Java --主要是应用于java平台

pathon --是用来参数优选的工具

svm-toy --一个可视化的工具，用来展示训练数据和分类界面，里面是源码，其编译后的程序在windows文件夹下

tools --主要包含四个pathon文件，用来数据抽样（subset），参数优选(grid),集成测试（easy）,数据检查（checkdata）

windows --包含libsvm四个exe程序包，我们所用到的库就是他们，里面还有个heart_scale，是一个样本文件，可以用记事本打开，用来测试用的。

其他的.h和.cpp文件都是程序的源码，可以编译出相应的exe文件。其中，最重要的是svm.h和svm.cpp文件，svm-predict,svm-scale.c和svm.train.c(还有一个svm-toy.c在svm-toy文件夹中)都是调用这个文件中的接口函数，编译后就是windows下相应的四个exe程序。

svm-train 用来对训练样本进行训练，之后生成一个.model文件，即svm的训练模型

svm-predict 用来对测试样本进行分类，参数主要有测试文件，model文件，以及一个生成的.predict文件，.predict是一个分类结果文件，保存分类的结果

svm-scale 用来对训练样本进行标准化，结果会生成两个文件，一个是range1文件，一个是.scale文件。

三.使用LIBSVM进行分类的一般步骤是：

1）按照LIBSVM软件包所要求的格式准备数据集；

2）对数据进行简单的缩放操作；

3）考虑选用RBF核函数；

4）采用交叉验证选择最佳参数C与g ；

5）采用最佳参数C与g 对整个训练集进行训练获取支持向量机模型；

6）利用获取的模型进行测试与预测。

详细介绍如下所示：

1.按照LIBSVM软件包所要求的格式准备数据集；

格式：

<label> <index1>:<value1> <index2>:<value2> ...

例：1 1:0.23 2:0.34 ... 13:1

-1 1:0.36 2:0.20 ... 13:0.56

<label> 是训练数据集的目标值,对于分类，它是标识某类的整数(支持多个类)；对于回归是任意实数;在上例中是1、-1；

<index> 是以1开始的整数，可以是不连续的(某项可能为空)；

<value>为实数，就是常说的自变量。检验数据文件中的label只用于计算准确度或误差，如果它是未知的，只需用一个数填写这一栏，也可以空着不填。

2.svmtrain(训练建模)

svmtrain [options] training_set_file [model_file]

DOS实例：

参数说明：

options为操作参数，可用的选项即表示的含义如下所示：

-s svm类型：SVM设置类型(默认0)

0 -- C-SVC

1 --v-SVC

2 – 一类SVM

3 -- e -SVR

4 -- v-SVR

-t 核函数类型：核函数设置类型(默认2)

0 – 线性：u'v

1 – 多项式：(r*u'v + coef0)^degree

2 – RBF函数：exp(-r|u-v|^2)

3 –sigmoid：tanh(r*u'v + coef0)

-d degree：核函数中的degree设置(默认3)

-g r(gama)：核函数中的 gama 包含的函数设置(默认1/ k)

-r coef0：核函数中的coef0设置(默认0)

-c cost：设置C-SVC，e-SVR和v-SVR的参数(默认1)

-n nu：设置c-SVC，一类SVM和v- SVR的参数(默认0.5)

-p e：设置e -SVR 中损失函数的值(默认0.1)

-m cachesize：设置cache内存大小，以MB为单位(默认40)

-e ?：设置允许的终止判据(默认0.001)

-h shrinking：是否使用启发式，0或1(默认1)

-wi weight：设置第几类的参数C为weight C(C-SVC中的C)(默认1)

-v n: n-fold交互检验模式

model_file：可选项，为要保存的结果文件，成为模型文件，以便在预测时使用

其中-g选项中的k是指输入数据中的属性数。option -v 随机地将数据剖分为n部分并计算交互检验准确度和均方根误差。

以上这些参数设置可以按照SVM的类型和核函数所支持的参数进行任意组合，如果设置的

参数在函数或SVM类型中没有也不会产生影响，程序不会接受该参数；如果应有的参数设置不正确，参数将采用默认值。

3.svm-predict的用法

svm-prdict[options] test_file model_file output_file

DOS实例：

参数解释：

（1）options为操作参数，可用的选项含义如下：

-b probably_estimates --是否需要进行概率估计预测，可选值为0、1，默认值是0

（2）model_file是由svmtrain产生的模型文件

（3）test_file是要进行预测的数据文件，格式也要符合libsvm格式，即使不知道label的值，也要任意填一个，svm-predict会在output_file中给出正确的label结果，如果知道label的值，就会输出正确率；

（4）out_file是由svm-predict的输出文件，表示预测的结果值

4.svmscale的用法:

svmscale是用来对原始样本进行缩放的，范围可以自己定，一般是[0,1]或[-1,1]。缩放的目的主要是

（1）防止某个特征过大或者过小，从而在训练中起的作用不平衡；

（2）为了计算速度，因为在核计算中，会用到内积运算和exp运算，不平衡的数据可能造成计算困难。

svm-scale [-l lower][-u upper]

[-y y_lower y_upper]

[-s save_filename]

[-r restore_file]filename

DOS实例：

其中，[]中都是可选项：

-l 设定数据下限；lower：设定的数据下限值，缺省为-1

-u 设定数据上限；upper: 设定的数据上限值，缺省为1

-y 是否对目标值同样进行缩放；y_lower为下限值，y_upper为上限值；

-s save_filename:表示将缩放的规则保存问文件save_filename

-r restore_filename:表示将按照已经保存的规则文件restore_filename进行缩放；

filename:待缩放的数据文件，文件格式按照libsvm格式

四.关于训练结果说明：

DOS实例：

optimization finished,#iter=162 //迭代次数是162

nu=1.0000 //nu是选择的核函数的类型

obj=-100.8.77288,rho=0.424462 //obj是SVM文件转换为的二次规划问题求解的最小值(W)，rho是判决函数的偏置项b,

nSV＝132，nBSV=107 //nSV是标准支持向量个数，nBSV是边界上的支持向量个数

Total nSV=132 //支持向量总个数

最后

以上就是热心蓝天最近收集整理的关于libsvm简单使用的全部内容，更多相关libsvm简单使用内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供，作为学习参考使用，或来自网络收集整理，版权属于原作者所有。

本文分类：svm之libsvm的使用
浏览次数：487 次浏览
发布日期：2023-05-14 10:28:02

libsvm简单使用

最后

评论列表共有 0 条评论

发表评论取消回复

libsvm简单使用

最后

相关文章

评论列表共有 0 条评论

发表评论 取消回复

发表评论取消回复