我是靠谱客的博主 尊敬石头,最近开发中收集的这篇文章主要介绍一个月刷完机器学习笔试题300题(12),觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

第十二天

1、假定你用一个线性SVM分类器求解二类分类问题,如下图所示,这些用红色圆圈起来的点表示支持向量

如果移除这些圈起来的数据,决策边界(即分离超平面)是否会发生改变?
A
Yes
B
No
正确答案是: B
从数据的分布来看,移除那三个数据,决策边界不会受影响。
2、如果将数据中除圈起来的三个点以外的其他数据全部移除,那么决策边界是否会改变?
image
A

B
不会
正确答案是: B
决策边界只会被支持向量影响,跟其他点无关。
3、关于SVM泛化误差描述正确的是
A
超平面与支持向量之间距离
B
SVM对未知数据的预测能力
C
SVM的误差阈值
正确答案是: B
统计学中的泛化误差是指对模型对未知数据的预测能力。
4、以下关于硬间隔hard margin描述正确的是
A
SVM允许分类存在微小误差
B
SVM允许分类是有大量误差
正确答案是:A
硬间隔意味着SVM在分类时很严格,在训练集上表现尽可能好,有可能会造成过拟合。
5、训练SVM的最小时间复杂度为O(n2),那么一下哪种数据集不适合用SVM?
A
大数据集
B
小数据集
C
中等大小数据集
D
和数据集大小无关
正确答案是:A
有明确分类边界的数据集最适合SVM
6、SVM的效率依赖于
A
核函数的选择
B
核参数
C
软间隔参数
D
以上所有
正确答案是:D
SVM的效率依赖于以上三个基本要求,它能够提高效率,降低误差和过拟合
7、支持向量是那些最接近决策平面的数据点
A

B

正确答案是:A
支持向量就在间隔边界上 ????
软间隔会不成立吧,分类错误的更近。
8、SVM在下列那种情况下表现糟糕
A
线性可分数据
B
清洗过的数据
C
含噪声数据与重叠数据点
正确答案是:C
当数据中含有噪声数据与重叠的点时,要画出干净利落且无误分类的超平面很难
9、假定你使用了一个很大γ值的RBF核,这意味着:
A
模型将考虑使用远离超平面的点建模
B
模型仅使用接近超平面的点来建模
C
模型不会被点到超平面的距离所影响
D
以上都不正确
正确答案是: B
SVM调参中的γ衡量距离超平面远近的点的影响。
对于较小的γ,模型受到严格约束,会考虑训练集中的所有点,而没有真正获取到数据的模式、对于较大的γ,模型能很好地学习到模型。
10、SVM中的代价参数表示:
A
交叉验证的次数
B
使用的核
C
误分类与模型复杂性之间的平衡
D
以上均不是
正确答案是:C
代价参数决定着SVM能够在多大程度上适配训练数据。
如果你想要一个平稳的决策平面,代价会比较低;如果你要将更多的数据正确分类,代价会比较高。可以简单的理解为误分类的代价。

最后

以上就是尊敬石头为你收集整理的一个月刷完机器学习笔试题300题(12)的全部内容,希望文章能够帮你解决一个月刷完机器学习笔试题300题(12)所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(57)

评论列表共有 0 条评论

立即
投稿
返回
顶部