概述
1 致谢
感谢赵老师的讲授。
2 前言
FaceBoxes是一种用来进行人脸检测的算法框架,我个人感觉还是比较好的,吸收了SSD的一些优点。
3 FaceBoxes的论文阅读
3.3. Anchor densification strategy
在3.3节中,论文主要讲到了,锚点致密化策略,
在阅读时,我看到一个概念不太清楚,
这部分文字说到,对于Conv3_2卷积层,这里的 stride size为64像素,这里我不太明白 stride size的含义,其实,它指的是不同锚点之间相距的步长,我把它称作锚间步长,其大小跟当前卷积层的 feature map的大小相关,还是以Conv3_2卷积层为例,其输出 feature map的大小为16x16,则对于特征图中的每一个像素点,与其相邻像素点对应的感受野的中心的距离,即为输入图像1024/16 = 64,即两个相邻感受野的步长间距,同时也是两个相邻锚的间距;
3.4 Loss函数
回归任务采用的是 smooth
L
1
L_1
L1 loss函数,其公式为:
s
m
o
o
t
h
L
1
(
x
)
=
{
0.5
x
2
if
∣
x
∣
<
1
∣
x
∣
−
0.5
otherwise
smooth_{L_1}(x)= left{begin{matrix} 0.5x^2 & text{if} left | x right | < 1\ left | xright |-0.5 & text{otherwise}\ end{matrix}right.
smoothL1(x)={0.5x2∣x∣−0.5if∣x∣<1otherwise
4 FaceBoxes的代码学习
4.1 网络架构
Inception模块需要自己定义,PyTorch没有提供Inception模块的封装类;
4.2 模型训练
FaceBoxes仅支持1024x1024图片的训练;
4.3 补充资料
4.3.1 cfg配置参数
steps:描述了三个输出模块的特征图的步长。
这里三个输出模块是指:Inception3、Conv3_2和Conv4_2三个模块;
steps的三个值32, 64, 128是跟网络结构有关的,根据网络结构计算出来的;
3.2.1 encode操作
encode是SSD中提出的一种特殊操作。
最后
以上就是真实纸飞机为你收集整理的FaceBoxes的学习笔记1 致谢2 前言3 FaceBoxes的论文阅读4 FaceBoxes的代码学习的全部内容,希望文章能够帮你解决FaceBoxes的学习笔记1 致谢2 前言3 FaceBoxes的论文阅读4 FaceBoxes的代码学习所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复