概述
目标检测
图像分类、目标检测、分割是计算机视觉领域的三大任务。
目标检测的目标就是识别+定位。
以下介绍目标检测几个基本概念:
锚框:
目标检测算法通常会在输入图像中采样大量的区域,然后判断这些区域中是否包含我们感兴趣的目标,并调整区域边缘从而更准确地预测目标的真实边界框(ground-truth bounding box)。这里我们介绍其中的一种方法:它以每个像素为中心生成多个大小和宽高比(aspect ratio)不同的边界框。这些边界框被称为锚框(anchor box)。
交并比:
衡量锚框和真实边界框之间的相似度。Jaccard系数可以衡量两个集合的相似度。给定集合A和B,它们的Jaccard系数即二者交集大小除以二者并集大小:
事实上我们可以把边界框内的像素区域看成是像素的集合。这样我们可以用两个边界框的像素集合的Jaccard系数衡量这两个边界框的相似度。当衡量两个边界框的相似度时,我们通常将Jaccard系数称为交并比(Intersection over Union,IoU),即两个边界框相交面积与相并面积之比,如图所示。交并比的取值范围在0和1之间:0表示两个边界框无重合像素,1表示两个边界框相等。
传统的目标检测框架,主要包括三个步骤:
(1)利用不同尺寸的滑动窗口框住图中的某一部分作为候选区域;
(2)提取候选区域相关的视觉特征
(3)利用分类器进行识别,比如常用的贝叶斯、SVM模型。
目前目标检测领域的深度学习方法主要分为两类:一阶段目标检测算法;两阶段(Two Stages)的目标检测算法。
一阶段目标检测算法:不需要产生候选框,直接将目标框定位的问题转化为回归(Regression)问题处理常见算法有YOLO、SSD等等。
二阶段目标检测算法:首先由算法生产候选框(如RPN),再通过卷积神经网络进行样本分类。常见的算法有R-CNN、Fast R-CNN、Faster R-CNN等等。
对于上述两种方法各有有缺点,一阶段方法在速度上占据优势,二阶段算法在准确率和算法精度上占据优势。
最后
以上就是饱满舞蹈为你收集整理的目标检测的全部内容,希望文章能够帮你解决目标检测所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复