概述
当面对一个机器学习问题时,有很多不同的思想来改进学习算法。
- 通过一个简单的算法来快速实现它,然后使用交叉验证集来测试数据;
- 画出相应的学习曲线;
- 误差分析;
机器学习分类模型存在一种情况叫偏斜类。偏斜类简单理解就是在训练模型时由于正样本和负样本之间的严重不平衡,导致模型最后检测全部都是1或者全部都是0。
精确率和召回率
几个常用术语
1) True positives(TP): 被正确地划分为正例的个数,即实际为正例且被分类器划分为正例的实例数;
2) False positives(FP): 被错误地划分为正例的个数,即实际为负例但被分类器划分为正例的实例数;
3) False negatives(FN):被错误地划分为负例的个数,即实际为正例但被分类器划分为负例的实例数;
4) True negatives(TN): 被正确地划分为负例的个数,即实际为负例且被分类器划分为负例的实例数。
精确率是针对我们预测结果而言的,它表示的是预测为正的样本中有多少是真正的正样本。那么预测为正就有两种可能了,一种就是把正类预测为正类(TP),另一种就是把负类预测为正类(FP),也就是
召回率针对我们原来的样本而言的,它表示的是样本中的正例有多少被预测正确了。那也有两种可能,一种是把原来的正类预测成正类(TP),另一种就是把原来的正类预测为负类(FN)。
精确率和召回率作为遇到偏斜类问题的评估度量值。需要对精确率和召回率进行权衡,权衡的方法为使用F1Score:
最终选择F1Score最高的算法3;
最后
以上就是无奈玉米为你收集整理的吴恩达机器学习(二十二)精确率和召回率的全部内容,希望文章能够帮你解决吴恩达机器学习(二十二)精确率和召回率所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复