概述
http://hi.baidu.com/windey1988/item/f711702c5d187b4e46996289
简单总结一下CVPR11年一篇改进L1跟踪算法的文章,即Real-time Visual Tracking Using Compressive Sensing。
先提一提ICCV09年这篇L1跟踪算法的,即Robust visual tracking using L1 minimization。这篇原始的L1跟踪算法的文章首先将Yi Ma成功用在人脸识别上面的稀疏表示引入到视觉跟踪中,加上粒子滤波的框架,就可以work了。算法的大致流程如下:
第一帧时设定初始跟踪位置,根据设定的初始化位置采样10个模板,再加上一个单位180维单位矩阵(对应180个平凡模板)组成一个190维的模板集。初始化10维权值向量,用于模板的更新。
从第二帧开始,采样粒子,对每个粒子求稀疏表示,保证稀疏系数非负。最稀疏的粒子就对应着预测的位置。同时根据当前预测的目标同模板的距离来更新权值,权值足够小则用当前预测目标替换掉该模板。
然后不断逐帧跟踪。
这篇文章有个亮点就是在粒子滤波框架中同时加入了一个仿射变换的运动模型。使得算法跟踪的是平行四边形的目标。大多数跟踪算法为了简易起见,都是使用矩形框来定位目标。
改进的文章大致有三个创新点。第一个是将OMP(正交匹配追踪)用于求解L1,大大减少了计算量。第二个是提出了背景模型,提高了算法的鲁棒性。第三个是提出了自己的跟踪算法准确性度量。
这里的L1问题如下:
压缩感知强调的是“压缩”。大概就是使用一组过完备的基,以远远低于抽样定理的频率采样到测量信号。同时只要测量矩阵满足RIP条件,那么我们就可以重构出原始信号。
压缩感知的重要用途就是计算机断层扫描。可以根据扫描得到的不太清晰的图像重构出高清晰度的图像,用在医学上。
论文中提到引入了压缩感知,就在于加入了一个满足RIP条件的随机观测矩阵。原始论文中直接根据初始位置得到180维图像信息。若目标过大时,将会损失掉大量的图像信息。这里引入随机观测矩阵降维,不会造成太大的信息损失,同时增加了算法的准确性,减少了大量计算量。
采用OMP代替Lasso算法求解稀疏表示。OMP全称是正交匹配追踪,其求解思路采用的是贪心策略。总是选取与待匹配信号内积最大的那个基加入解集合中,用最小二乘法拟合求得残差,再对残差进行同样的处理,直到残差足够小或者达到一定的迭代次数。
同样,作者引入了背景模型。原始的那篇L1没有考虑背景,一个很大的假设就是使用噪声模板(平凡模板)可以有效地重构候选采样点。实际上,当采样点属于背景时根本无法求得其稀疏表示。而引入背景模型就不同了,有了背景模型,不管是前景目标还是背景我们都可以得到足够稀疏的系数。背景模型是如何得到的呢?在初始目标的周围采样得到。算法中粒子的权值与其重构的残差相对应,残差最小的那个粒子就对应预测目标。根据粒子的权值选择性地更新目标模板。
论文同样提出了一个新的跟踪精确性度量,原始的度量一般采用的是真实状态的中心位置和预测目标的中心位置的距离。现在改为考虑真实区域和预测区域的重叠面积。
总结,算法经过改进后基本可以达到实时,同时和原始算法的准确性大致相当。引入背景模型后大大提高了其准确性
最后
以上就是想人陪招牌为你收集整理的基于OMP的L1跟踪算法的全部内容,希望文章能够帮你解决基于OMP的L1跟踪算法所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复