概述
论文原文:Recognizing Objects in Range Data Using Regional Point Descriptors
论文阅读:在距离数据中使用区域点描述子识别目标
- 简介
- 介绍了两种区域描述子,适用于复杂环境的3d物体识别
- 3d物体识别中存在的问题:
(1)存在遮挡:
(2)存在许多相似形状和大小相似物体
(3)距离扫描仪器的分辨率不够
(4) 高速扫描时会存在显著噪声
- 描述子
- 设计描述符时需要考虑如下问题:
(1)支撑区域形状:分为若干个自取与,计算每个自取的直方图
(2)如何在三维空间的直方图上映射光束:通过对齐到支撑区域,原点曲面方向的北向,同时方位角会存在一定自由度
如下描述符均采用输入点及其残差和支撑区域,计算描述符,3种方法采用不同消除自度的方法和支撑平面形状 - 3D局部形状描述符(3D shape contexts)SC
<1>: 是2d shape contexts直接扩展而来,以p为圆点构建了一个圆(其北向为点p切平面方向)。见下图:
<2>:支撑区域:按方位角、俯仰角等分,记:
J + 1 J+1 J+1:个径向半径为: R = { R 0 , . . . , R J } R={R_0,...,R_J} R={R0,...,RJ}
K + 1 K+1 K+1:个俯仰角为: Θ = { Θ 0 , . . , Θ k } Theta={Theta_0,..,Theta_k} Θ={Θ0,..,Θk}
L + 1 L+1 L+1:个俯仰角为: Φ = { Φ 0 , . . , Φ k } Phi={Phi_0,..,Phi_k} Φ={Φ0,..,Φk}
<3>:每个区域用 J × K × L J×K×L J×K×L表示:
r m i n = R 0 r_{min}=R_0 rmin=R0
r m a x = R J r_{max}=R_J rmax=RJ
R j = exp { l n ( r m i n ) + j J l n ( r m a x r m i n ) } R_j=exp{ln(r_{min})+frac{j}{J}ln(frac{r_{} max}{r_{min}})} Rj=exp{ln(rmin)+Jjln(rminrmax)}
<4>:权重:每个区域 ( j , k , l ) ∈ { [ R j , R j + 1 ) , [ Φ k , Φ k + 1 ) , [ Θ l , Θ l + 1 ) } (j,k,l)in{ [R_j,R_{j+1}),[Phi_k,Phi_{k+1}),[Theta_l,Theta_{l+1})} (j,k,l)∈{[Rj,Rj+1),[Φk,Φk+1),[Θl,Θl+1)}对应一个权重 w ( p i ) w(p_i) w(pi):
V ( j , k , l ) : V(j,k,l): V(j,k,l):容积
p i : p_i: pi:局部区域强度
w ( p i ) = 1 p i V ( j , k , l ) w(p_i)=frac{1}{p_isqrt{V(j,k,l)}} w(pi)=piV(j,k,l)1
<5>:为了进行更好的比较,去除方位角上的自由度,选择 Φ 0 Phi_0 Φ0作为初始的shape context(局部描述符),然后旋转局部描述符到L的北极仿效 - 局部调谐描述符(论文只简单介绍,详细要见其第14个参考文献)HSC
对区域采样来计算球谐函数,描述符是在方位角上不变的幅值向量,移除了在方位角上的自由度,保留了临近点的信息具有更好的描述性。
调谐函数的基函数如下:该基函数将会在方位角的频域方向产生一个相位移动
A l m : A_l^m: Alm:振幅
f ( θ , ϕ ) = ∑ l = 0 ∞ ∑ m = − l m = l A l m Y l m ( θ , ϕ ) f(theta,phi)=sum_{l=0}^inftysum^{m=l}_{m=-l}A_l^mY_l^m(theta,phi) f(θ,ϕ)=l=0∑∞m=−l∑m=lAlmYlm(θ,ϕ)
3D形状定义指定小块的球谐描述符 f j ( θ , ϕ ) f_j(theta,phi) fj(θ,ϕ)
R j ≤ R ≤ R j + 1 R_j leq R leq R_{j+1} Rj≤R≤Rj+1
S C : 3 D 形 状 描 述 符 SC:3D形状描述符 SC:3D形状描述符
f j ( θ , ϕ ) = S C ( j , k , l ) , θ k < θ ≤ θ k + 1 , ϕ l < ϕ < ϕ l + 1 f_j(theta,phi)=SC(j,k,l),theta_k<theta leq theta_{k+1},phi_l<phi<phi_{l+1} fj(θ,ϕ)=SC(j,k,l),θk<θ≤θk+1,ϕl<ϕ<ϕl+1
频宽 b b b:描述符只存储谐波的最低频分量的带宽,公式如下:
H S C ( l , m . k ) = ∣ ∣ A l , k m ∣ ∣ , ( l , m = 0 , . . . , b ) ( r = 0 , . . . , K ) m > = 0 HSC(l,m.k)=||A^m_{l,k}||,(l,m=0,...,b)(r=0,...,K)m>=0 HSC(l,m.k)=∣∣Al,km∣∣,(l,m=0,...,b)(r=0,...,K)m>=0
得到球谐函数的维数为: K ∗ b ( b + 1 ) 2 K*frac{b(b+1)}{2} K∗2b(b+1),不受方位角和俯仰角划分数量影响
S H ( f ) : SH(f): SH(f):关于b的向量,用来描述全局形状 S H l ( f ) = ∣ ∣ ∑ m − l l A l m Y l m ∣ ∣ SH_l(f)=||sum_{m-l}^lA_l^mY_l^m|| SHl(f)=∣∣∑m−llAlmYlm∣∣ - spin-image 描述符SI
最常用的3D描述符在识别、建模、分类上广泛应用。
支撑平面:以点p为中心,半径为r,高度为h,其轴线与点p的切平平面法线对齐。
支撑平面的划分:J方向:径向,K:垂直方向,形成 j × K j×K j×K的圆环,通过计算每个环内的梯度得到基于点P的自旋图像,形成2D直方图。
每个点 p i p_i pi的权重 q i q_i qi是该点的强度值的逆,每个环内求和消除方位角方向上的自由度,使自旋图像具有旋转不变性,具有 J × K J×K J×K为特征向量
- 使用描述点做匹配
- 局部形状描述符和3D旋装描述符:使用两特征向量之间的距离,作为准确度
- 局部调谐描述符:使用协防差矩阵的归一化函数的逆,作为准确度
- Representative descriptor method:方法进行匹配
已知:
p 1 , . . . , p M : p_1,...,p_M: p1,...,pM:每次扫描 S i S_i Si产生M个描述符
q 1 , . . . , q k : q_1,...,q_k: q1,...,qk:用来查询的k个描述符
k < < M : k<< M: k<<M:用来查询的k个描述符称之为Representative descriptor (RDS)
对于每次扫描 S i S_i Si,和一个描述符 q k q_k qk,可以从 S i S_i Si产生的描述符中找到与 q k q_k qk距离最小的点 p m p_m pm,距离为 l 2 l_2 l2,让后将所有查询点 q k q_k qk相对于 p m p_m pm的距离求和,得到的值成为representative descriptor cost(描述子残差):最佳匹配的点 c o s t ( S q , S i ) cost(S_q,S_i) cost(Sq,Si)值最小
c o s t ( S q , S i ) = ∑ k ∈ { 1 , . . , k } m i n m ∈ { 1 , . . . , M } d i s t ( q k , p m ) cost(S_q,S_i)=sum_{kin{1,..,k}}min_{min{1,...,M}dist(q_k,p_m)} cost(Sq,Si)=k∈{1,..,k}∑minm∈{1,...,M}dist(qk,pm)
最后
以上就是多情铃铛为你收集整理的PCL库学习九(形状、调谐、旋转图像描述子)的全部内容,希望文章能够帮你解决PCL库学习九(形状、调谐、旋转图像描述子)所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
发表评论 取消回复