PCL库学习九（形状、调谐、旋转图像描述子）

286 阅读 0 评论 189 点赞

我是靠谱客的博主多情铃铛，这篇文章主要介绍PCL库学习九（形状、调谐、旋转图像描述子），现在分享给大家，希望可以做个参考。

论文原文：Recognizing Objects in Range Data Using Regional Point Descriptors

论文阅读：在距离数据中使用区域点描述子识别目标

简介

介绍了两种区域描述子，适用于复杂环境的3d物体识别
3d物体识别中存在的问题：
（1）存在遮挡：
（2）存在许多相似形状和大小相似物体
（3）距离扫描仪器的分辨率不够
（4）高速扫描时会存在显著噪声

描述子

设计描述符时需要考虑如下问题：
（1）支撑区域形状：分为若干个自取与，计算每个自取的直方图
（2）如何在三维空间的直方图上映射光束：通过对齐到支撑区域，原点曲面方向的北向，同时方位角会存在一定自由度
如下描述符均采用输入点及其残差和支撑区域，计算描述符，3种方法采用不同消除自度的方法和支撑平面形状
3D局部形状描述符(3D shape contexts)SC
<1>: 是2d shape contexts直接扩展而来，以p为圆点构建了一个圆（其北向为点p切平面方向）。见下图：

<2>:支撑区域:按方位角、俯仰角等分，记：
$J + 1$ :个径向半径为： $R={R_0,...,R_J}$
$K + 1$ :个俯仰角为： $Theta={Theta_0,..,Theta_k}$
$L + 1$ :个俯仰角为： $Phi={Phi_0,..,Phi_k}$
<3>:每个区域用 $J \times K \times L$ 表示:
$r_{min}=R_0$
$r_{max}=R_J$
$R_j=exp{ln(r_{min})+frac{j}{J}ln(frac{r_{} max}{r_{min}})}$
<4>:权重：每个区域 $[R_j,R_{j+1}),[Phi_k,Phi_{k+1}),[Theta_l,Theta_{l+1})}$ 对应一个权重 $w(p_i)$ :
$V (j, k, l) :$ 容积
$p_i:$ 局部区域强度
$w(p_i)=frac{1}{p_isqrt{V(j,k,l)}}$
<5>:为了进行更好的比较，去除方位角上的自由度，选择 $Phi_0$ 作为初始的shape context（局部描述符），然后旋转局部描述符到L的北极仿效
局部调谐描述符（论文只简单介绍，详细要见其第14个参考文献）HSC
对区域采样来计算球谐函数，描述符是在方位角上不变的幅值向量，移除了在方位角上的自由度,保留了临近点的信息具有更好的描述性。
调谐函数的基函数如下：该基函数将会在方位角的频域方向产生一个相位移动
$A_l^m:$ 振幅
$f(theta,phi)=sum_{l=0}^inftysum^{m=l}_{m=-l}A_l^mY_l^m(theta,phi)$
3D形状定义指定小块的球谐描述符 $f_j(theta,phi)$
$R_j leq R leq R_{j+1}$
$S C : 3 D 形状描述符$
$f_j(theta,phi)=SC(j,k,l),theta_k<theta leq theta_{k+1},phi_l<phi<phi_{l+1}$
频宽 $b$ ：描述符只存储谐波的最低频分量的带宽,公式如下：
$HSC(l,m.k)=||A^m_{l,k}||,(l,m=0,...,b)(r=0,...,K)m>=0$
得到球谐函数的维数为： $K ∗ b ( b + 1 ) 2 K*frac{b(b+1)}{2}$ ,不受方位角和俯仰角划分数量影响
$S H (f) :$ 关于b的向量，用来描述全局形状 $SH_l(f)=||sum_{m-l}^lA_l^mY_l^m||$
spin-image 描述符SI
最常用的3D描述符在识别、建模、分类上广泛应用。
支撑平面：以点p为中心，半径为r,高度为h，其轴线与点p的切平平面法线对齐。
支撑平面的划分：J方向：径向，K:垂直方向，形成 $j \times K$ 的圆环，通过计算每个环内的梯度得到基于点P的自旋图像，形成2D直方图。
每个点 $p_i$ 的权重 $q_i$ 是该点的强度值的逆，每个环内求和消除方位角方向上的自由度，使自旋图像具有旋转不变性，具有 $J \times K$ 为特征向量

使用描述点做匹配

局部形状描述符和3D旋装描述符：使用两特征向量之间的距离，作为准确度
局部调谐描述符：使用协防差矩阵的归一化函数的逆，作为准确度
Representative descriptor method：方法进行匹配
已知：
$p_1,...,p_M:$ 每次扫描 $S_i$ 产生M个描述符
$q_1,...,q_k:$ 用来查询的k个描述符
$k < < M :$ 用来查询的k个描述符称之为Representative descriptor （RDS）
对于每次扫描 $S_i$ ,和一个描述符 $q_k$ ,可以从 $S_i$ 产生的描述符中找到与 $q_k$ 距离最小的点 $p_m$ ,距离为 $l_2$ ,让后将所有查询点 $q_k$ 相对于 $p_m$ 的距离求和，得到的值成为representative descriptor cost（描述子残差）：最佳匹配的点 $cost(S_q,S_i)$ 值最小
$cost(S_q,S_i)=sum_{kin{1,..,k}}min_{min{1,...,M}dist(q_k,p_m)}$