概述
Adaptive Object Detection Using Adjacency and Zoom Prediction
在本文中,我们建议使用一种自适应地将计算资源定向到可能包含对象的子区域的搜索策略。与基于固定锚点位置的方法相比,我们的方法自然适合对象实例稀疏且小的情况。
我们考虑以下自适应搜索策略。我们的算法不是先固定一组锚区域,而是从整个图像开始。然后递归地将图像划分为子区域(参见图2),直到确定给定区域不太可能包含任何小对象为止。该过程中访问的区域有效地充当了锚点,它们被分配了预测附近对象的边界框的任务。我们算法的一个显著特点是,是否进一步划分一个区域的决策是基于该区域的特征提取。因此,锚点区域集的生成取决于图像内容。对于只有少量小对象的图像,大多数区域在搜索的早期被修剪,在对象附近留下一些小的锚区域。对于只包含大型实例的图像,我们的方法优雅地回到依赖于少量大型锚区域的现有方法。通过这种方式,我们的算法自适应地将其计算资源定向到可能包含对象的区域。
给定一个输入锚点区域,AZ-Net输出一个标量缩放指示器,该指示器用于决定是否进一步缩放(除)该区域和一组带置信度评分的边界框,或者进行邻接预测。然后利用具有高置信度的邻域预测作为后续目标检测器的区域建议。该网络从整个图像开始递归应用,生成一组自适应的方案。
我们的算法以较快的帧速率实现了接近最先进方法的检测图。代码已在https://github.com/luyongxi/az-net上公开。
我们的目标检测算法由两个步骤组成。在步骤1中,使用自适应搜索和AZ-Net生成一组类无关的区域建议(参见算法1)。在我们的实验中,探测器是Fast R-CNN。我们的重点是改进第一步。我们考虑一个递归搜索策略,从整个图像作为根区域开始。对于搜索过程中遇到的任何区域,该算法都从该区域提取特征,计算缩放指示器和邻接预测。将置信度得分高于阈值的邻接预测包含在输出区域建议集中。如果缩放指示器高于阈值,则表示当前区域可能包含小对象。为了检测这些嵌入的小对象,将当前区域划分为子区域,如图2所示。然后,以与父区域相同的方式递归处理每个子区域,直到其区域或缩放指示器太小为止。图1演示了这个过程。
Design of Building Blocks
看到这里大家估计就很明白了,和fastrcn基本一致,不同之处在于,放缩指示器用来继续分化区域,训练也很简单,出来普通的rcnn之外,加了个放缩指示器的输出。
最后
以上就是简单小伙为你收集整理的AZNet的全部内容,希望文章能够帮你解决AZNet所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复