我是靠谱客的博主 舒心宝马,最近开发中收集的这篇文章主要介绍支持向量机:如何对不可分数据进行分类?,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

全文共1107字,预计学习时长3分钟

图源:unsplash

在机器学习中,支持向量模型用于基于相关学习算法的监督学习,该算法用于分类和基于回归的分析。如果有数据示例被标记为属于其中一类,那么支持向量机训练算法会把新数据分配给其中一类作为非概率二元线性分类器。

 

支持向量机模型是数据点在空间中的一种表示,映射到每一类中,从而使单独类的数据示例由最大化的明确间隔来划分。然后,新数据的示例被映射到同一空间,并根据它们落在间隔的哪一侧来预测它们属于哪一类。

 

除了线性分类外,支持向量机还可以使用核技巧对非线性数据进行分类。当无法进行监督学习且数据未被标记时,采用数据聚类方法将数据归类,此时该学习不受监督,并采用支持向量聚类算法。该支持向量算法用于将未标记的数据归入到其最接近的类别。

 

当原始问题在有限维平面上表示时,线性空间可能无法实现对数据的分类。因此,本文提出了一种高维的数据分离和分类方法,以保持较低的计算量,从而可以通过定义核函数来轻松地在空间中计算输入向量对。

 

核技巧

 

核技巧实际上是在一个平面上给出一个解,而这个解本来并不存在于问题中。如果可以得到如下这组数据,你就会发现,这些数据不能用直线进行线性分类。

 

如果有下图中x-y轴的值,并将其绘制在x-y的二维平面上,就会发现其无法分类。

 

如果要添加一个新的平面,就需要有一个三维值,该值可轻松地分类红色和绿色数据点。此处尝试3个方程:

 

· x+y

· xy

· x**2

 

如上表所示,可以清楚地看到xy公式用数值0和2将红色和绿色的数据点分离。

 

现在添加第三维度作为z轴,并在其上绘制xy的值。可以看到,当红色数据点下降,绿色数据点上升时,这些数据点很容易分离。

 

在线性空间中,我们知道解在xy=0和xy=2之间,即xy=1,y=1/x,正是上图所示的线形。

 

此外,我们还需注意,在高维特征空间中运行会增加支持向量机的泛化误差,但在样本量足够大的情况下,该算法仍能很好执行。

一起分享AI学习与发展的干货

欢迎关注全平台AI垂类自媒体 “读芯术”

(添加小编微信:dxsxbb,加入读者圈,一起讨论最新鲜的人工智能科技哦~)

最后

以上就是舒心宝马为你收集整理的支持向量机:如何对不可分数据进行分类?的全部内容,希望文章能够帮你解决支持向量机:如何对不可分数据进行分类?所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(41)

评论列表共有 0 条评论

立即
投稿
返回
顶部