我是靠谱客的博主 多情铃铛,最近开发中收集的这篇文章主要介绍PCL库学习九(形状、调谐、旋转图像描述子),觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

论文原文:Recognizing Objects in Range Data Using Regional Point Descriptors

论文阅读:在距离数据中使用区域点描述子识别目标

  1. 简介
  • 介绍了两种区域描述子,适用于复杂环境的3d物体识别
  • 3d物体识别中存在的问题:
    (1)存在遮挡:
    (2)存在许多相似形状和大小相似物体
    (3)距离扫描仪器的分辨率不够
    (4) 高速扫描时会存在显著噪声
  1. 描述子
  • 设计描述符时需要考虑如下问题:
    (1)支撑区域形状:分为若干个自取与,计算每个自取的直方图
    (2)如何在三维空间的直方图上映射光束:通过对齐到支撑区域,原点曲面方向的北向,同时方位角会存在一定自由度
    如下描述符均采用输入点及其残差和支撑区域,计算描述符,3种方法采用不同消除自度的方法和支撑平面形状
  • 3D局部形状描述符(3D shape contexts)SC
    <1>: 是2d shape contexts直接扩展而来,以p为圆点构建了一个圆(其北向为点p切平面方向)。见下图:
    在这里插入图片描述
    <2>:支撑区域:按方位角、俯仰角等分,记:
    J + 1 J+1 J+1:个径向半径为: R = { R 0 , . . . , R J } R={R_0,...,R_J} R={R0,...,RJ}
    K + 1 K+1 K+1:个俯仰角为: Θ = { Θ 0 , . . , Θ k } Theta={Theta_0,..,Theta_k} Θ={Θ0,..,Θk}
    L + 1 L+1 L+1:个俯仰角为: Φ = { Φ 0 , . . , Φ k } Phi={Phi_0,..,Phi_k} Φ={Φ0,..,Φk}
    <3>:每个区域用 J × K × L J×K×L J×K×L表示:
    r m i n = R 0 r_{min}=R_0 rmin=R0
    r m a x = R J r_{max}=R_J rmax=RJ
    R j = exp ⁡ { l n ( r m i n ) + j J l n ( r m a x r m i n ) } R_j=exp{ln(r_{min})+frac{j}{J}ln(frac{r_{} max}{r_{min}})} Rj=exp{ln(rmin)+Jjln(rminrmax)}
    <4>:权重:每个区域 ( j , k , l ) ∈ { [ R j , R j + 1 ) , [ Φ k , Φ k + 1 ) , [ Θ l , Θ l + 1 ) } (j,k,l)in{ [R_j,R_{j+1}),[Phi_k,Phi_{k+1}),[Theta_l,Theta_{l+1})} (j,k,l){[Rj,Rj+1),[Φk,Φk+1),[Θl,Θl+1)}对应一个权重 w ( p i ) w(p_i) w(pi):
    V ( j , k , l ) : V(j,k,l): V(j,k,l):容积
    p i : p_i: pi:局部区域强度
    w ( p i ) = 1 p i V ( j , k , l ) w(p_i)=frac{1}{p_isqrt{V(j,k,l)}} w(pi)=piV(j,k,l) 1
    <5>:为了进行更好的比较,去除方位角上的自由度,选择 Φ 0 Phi_0 Φ0作为初始的shape context(局部描述符),然后旋转局部描述符到L的北极仿效
  • 局部调谐描述符(论文只简单介绍,详细要见其第14个参考文献)HSC
    对区域采样来计算球谐函数,描述符是在方位角上不变的幅值向量,移除了在方位角上的自由度,保留了临近点的信息具有更好的描述性。
    调谐函数的基函数如下:该基函数将会在方位角的频域方向产生一个相位移动
    A l m : A_l^m: Alm:振幅
    f ( θ , ϕ ) = ∑ l = 0 ∞ ∑ m = − l m = l A l m Y l m ( θ , ϕ ) f(theta,phi)=sum_{l=0}^inftysum^{m=l}_{m=-l}A_l^mY_l^m(theta,phi) f(θ,ϕ)=l=0m=lm=lAlmYlm(θ,ϕ)
    3D形状定义指定小块的球谐描述符 f j ( θ , ϕ ) f_j(theta,phi) fj(θ,ϕ)
    R j ≤ R ≤ R j + 1 R_j leq R leq R_{j+1} RjRRj+1
    S C : 3 D 形 状 描 述 符 SC:3D形状描述符 SC:3D
    f j ( θ , ϕ ) = S C ( j , k , l ) , θ k < θ ≤ θ k + 1 , ϕ l < ϕ < ϕ l + 1 f_j(theta,phi)=SC(j,k,l),theta_k<theta leq theta_{k+1},phi_l<phi<phi_{l+1} fj(θ,ϕ)=SC(j,k,l),θk<θθk+1,ϕl<ϕ<ϕl+1
    频宽 b b b:描述符只存储谐波的最低频分量的带宽,公式如下:
    H S C ( l , m . k ) = ∣ ∣ A l , k m ∣ ∣ , ( l , m = 0 , . . . , b ) ( r = 0 , . . . , K ) m > = 0 HSC(l,m.k)=||A^m_{l,k}||,(l,m=0,...,b)(r=0,...,K)m>=0 HSC(l,m.k)=Al,km,(l,m=0,...,b)(r=0,...,K)m>=0
    得到球谐函数的维数为: K ∗ b ( b + 1 ) 2 K*frac{b(b+1)}{2} K2b(b+1),不受方位角和俯仰角划分数量影响
    S H ( f ) : SH(f): SH(f):关于b的向量,用来描述全局形状 S H l ( f ) = ∣ ∣ ∑ m − l l A l m Y l m ∣ ∣ SH_l(f)=||sum_{m-l}^lA_l^mY_l^m|| SHl(f)=mllAlmYlm
  • spin-image 描述符SI
    最常用的3D描述符在识别、建模、分类上广泛应用。
    支撑平面:以点p为中心,半径为r,高度为h,其轴线与点p的切平平面法线对齐。
    支撑平面的划分:J方向:径向,K:垂直方向,形成 j × K j×K j×K的圆环,通过计算每个环内的梯度得到基于点P的自旋图像,形成2D直方图。
    每个点 p i p_i pi的权重 q i q_i qi是该点的强度值的逆,每个环内求和消除方位角方向上的自由度,使自旋图像具有旋转不变性,具有 J × K J×K J×K为特征向量
  1. 使用描述点做匹配
  • 局部形状描述符和3D旋装描述符:使用两特征向量之间的距离,作为准确度
  • 局部调谐描述符:使用协防差矩阵的归一化函数的逆,作为准确度
  • Representative descriptor method:方法进行匹配
    已知:
    p 1 , . . . , p M : p_1,...,p_M: p1,...,pM:每次扫描 S i S_i Si产生M个描述符
    q 1 , . . . , q k : q_1,...,q_k: q1,...,qk:用来查询的k个描述符
    k < < M : k<< M: k<<M:用来查询的k个描述符称之为Representative descriptor (RDS)
    对于每次扫描 S i S_i Si,和一个描述符 q k q_k qk,可以从 S i S_i Si产生的描述符中找到与 q k q_k qk距离最小的点 p m p_m pm,距离为 l 2 l_2 l2,让后将所有查询点 q k q_k qk相对于 p m p_m pm的距离求和,得到的值成为representative descriptor cost(描述子残差):最佳匹配的点 c o s t ( S q , S i ) cost(S_q,S_i) cost(Sq,Si)值最小
    c o s t ( S q , S i ) = ∑ k ∈ { 1 , . . , k } m i n m ∈ { 1 , . . . , M } d i s t ( q k , p m ) cost(S_q,S_i)=sum_{kin{1,..,k}}min_{min{1,...,M}dist(q_k,p_m)} cost(Sq,Si)=k{1,..,k}minm{1,...,M}dist(qk,pm)

最后

以上就是多情铃铛为你收集整理的PCL库学习九(形状、调谐、旋转图像描述子)的全部内容,希望文章能够帮你解决PCL库学习九(形状、调谐、旋转图像描述子)所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(41)

评论列表共有 0 条评论

立即
投稿
返回
顶部