我是靠谱客的博主 畅快小蜜蜂,最近开发中收集的这篇文章主要介绍常用的核函数,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

在机器学习建模过程中,核函数的选择通常和应用场景有关,有专用核函数,但实际上,还是有一些通用核函数,本文重点介绍一些通用核函数,理解核函数,有助于在实战过程中选择合理的调参范围,指导我们对超参数的调整。

常用的核函数有两种,一种是多项式核函数,另外一种是高斯核函数。


1.多项式核函数

数学表达式为:

            K(x_{i},x_{j})=(gamma x_{i}^{T}x_{j}+c)^{n}, 其中gamma为正数,C非负,相对于线性和函数可以表达更复杂,非直线的分隔超平面。多项式阶数n不宜太高,否则模型求解困难,尤其当x_{i}cdot x_{j}> 1时,经过n次方运算后,数值变得非常大,核函数因此而不稳定。

而线性核函数,即K(x_{i},x_{j})= x_{i}^{T}cdot x_{j},是多项式核函数在n=1,gamma =1,c=0的特例,优点是简洁,缺点是对线性不可分数据集没有解决办法。


2. 高斯核函数

K(x_{i},x_{j})=exp(frac{(x_{i}-x_{j})^{2}}{2sigma ^{2}}),如果输入特征是一维标量,该函数的形状为钟形曲线,参数sigma控制曲线的宽度(胖瘦)。

 

此核函数对应的特征转换函数phi (x)=sum_{i=0}^{infty }exp(-x^{2})sqrt{frac{2^{i}}{i!}}x^{i},这个无限多累加器的意义就是把特征向量映射到无限维空间,也就是说,高斯函数可以把输入特征向量扩展到无限维度的空间里。高斯核函数计算出来的值永远在0到1之间。


3. 实践中核函数的选取依据

针对样本数很大的情况,可以选择复杂一点的模型,大量的数据可以弥补过拟合问题,数据量小,应该选择简单模型,如果出现欠拟合,可以增加多项式特征。

 

黄永昌. scikit-learn机器学习常用算法原理及编程实战 机械工业出版社 2018.

最后

以上就是畅快小蜜蜂为你收集整理的常用的核函数的全部内容,希望文章能够帮你解决常用的核函数所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(34)

评论列表共有 0 条评论

立即
投稿
返回
顶部