我是靠谱客的博主 娇气电话,最近开发中收集的这篇文章主要介绍图像拼接原理与相关技术,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

(本文参考了多个blog的内容,并做了总结与归纳)

       所谓图像拼接就是考虑如何将多幅来自同一场景的有重叠区域的小尺寸图像合成一幅大尺寸的高质量的图像。这种技术为图像降噪、视场(Field of view)扩展、背景场景构建(运动物体去除)、去模糊、空间分辨率的提高和动态范围的增强提供了更佳的策略。同样,图像拼接也应用于图像恢复、计算机特效、图像压缩与视频编辑等领域。

图像拼接的一般性问题:
       图像拼接能否达到期望的效果主要取决于能否选择出一个鲁棒性的而且高效快速的图像对准方法。但各种方法都存在他们的这样那样的缺陷。对于基于空域匹配的方法,它是利用相似度测量比较两幅图的像素点或像素块,这种方法最为直观,但难以处理旋转和缩放等问题,而且全局搜索的运算代价太大,难以应对光照变化的影响。对于基于图像特征的方法,一般提取图像边界、轮廓线、拐点等纹理信息做特征匹配,进一步构建映射方程组。这种方法对特征点的选取十分敏感。

1.算法思想

        在实现全景视频(Panoramic Video)系统、地理信息系统(GIS)及其它一些应用的过程中,我们通常会碰到这样的一个问题,就是要把几幅小的图象拼接成一幅大的图像。为了能让计算机自动对准图像我们要求待拼接的图像边界有部分重叠,计算机正是利用这些信息进行匹配对准。匹配算法的总体思想是既要保证对准的精度,又要保证运算量不至过大。简单的块匹配方法是在一般图像中,相邻的像素点的灰度值相差不大。因此,可在第二幅图像的边界取一个网格,然后将网格在第一幅图像上移动,计算所有网格点的两幅图像对应象素点的RGB值的差的平方和。记录最小的值的网格位置,即认为是最佳匹配位置。为了减小运算量,常规的做法是将匹配分为两个步骤,第一步是粗略匹配,在该阶段网格每次水平或垂直移动一个网格间距。在完成粗略匹配之后,之后在当前最佳匹配点处进行精确匹配,在该阶段以当前最佳匹配点为中心,网格向上下、左右各移动一个小步长。初始步长为粗略拼接时移动步长的一半,即为半个网格间距。不断的与当前最小平方和进行比较,如果比当前值优,就替换当前最佳匹配点。循环进行这个过程每次步长减半,直到水平步长和垂直步长均为0为止。


        其实,如果用相位相关能够把有位移的图像配准的话,旋转也是可以的。因为如果把直角坐标转换成极坐标,那样求旋转和求位移就是同一回事了。
其实对于特征来说,不同的图象应该是不同的方法的,对于指纹来说,特征是很明显的。



       图像拼接技术主要包括两个关键环节即图像配准图像融合对于图像融合部分,由于其耗时不太大,且现有的几种主要方法效果差别也不多,所以总体来说算法上比较成熟。而图像配准部分是整个图像拼接技术的核心部分,它直接关系到图像拼接算法的成功率和运行速度,因此配准算法的研究是多年来研究的重点。(图像融合的相关技术将在本blog的后续章节介绍)。


      图像配准是图像融合的基础,而且图像配准算法的计算量一般非常大,因此图像拼接技术的发展很大程度上取决于图像配准技术的创新。早期的图像配准技术主要采用点匹配法,这类方法速度慢、精度低,而且常常需要人工选取初始匹配点,无法适大数据量图的融合。图像拼接的方法很多,不同的算法步骤会有一定差异,但大致的过程是相同的。一般来说,图像拼接主要包括以下五步:图像预处理(去噪、边缘提取、直方图处理等基本图像处理操作;建立图像的匹配模板;对图像做傅里叶小波变换等操作);图像配准(采取一定匹配策略找出待拼接图像中的模板或特征点在参考图像中对应的位置);建立变换模型(根据模板或图像特征变换之间的对应关系,计算出数学模型中各参数值,从而建立两幅图像之间的变换关系);统一坐标变换(根据建立的数学模型,将待拼接的图像转换到参考图像的坐标系中,完成统一的坐标变换);融合重构(将带拼接图像的重合区域进行融合得到拼接重构的平滑无缝全景图像)。


        目前的图像配准算法基本上可以分为两类:基于频域的方法(相位相关方法)和基于时域的方法。
        

        相位相关法最早是由Kuglin和Hines在1975年提出的,并且证明在纯二维平移的情形下,拼接精度可以达到1个像素,多用于航空照片和卫星遥感图像的配准等领域。该方法对拼接的图像进行快速傅立叶变换,将两幅待配准图像变换到频域,然后通过它们的互功率谱直接计算出两幅图像间的平移矢量,从而实现图像的配准。由于其具有简单而精确的特点,后来成为最有前途的图像配准算法之一。但是相位相关方法一般需要比较大的重叠比例(通常要求配准图像之间有50%的重叠比例),如果重叠比例较小,则容易造成平移矢量的错误估计,从而较难实现图像的配准。


       基于时域的方法又可具体分为基于特征的方法和基于区域的方法。基于特征的方法首先找出两幅图像中的特征点(如边界点、拐点),并确定图像间特征点的对应关系,然后利用这种对应关系找到两幅图像间的变换关系。这一类方法不直接利用图像的灰度信息,因而对光线变化不敏感,但对特征点对应关系的精确程度依赖很大。这一类方法采用的思想较为直观,目前大部分的图像配准算法都可以归为这一类。基于区域的方法是以一幅图像重叠区域中的一块作为模板,在另一幅图像中搜索与此模板最相似的匹配块,这种算法精度较高,但计算量过大。


        按照匹配算法的具体实现又可以分为直接法和搜索法两大类,直接法主要包括变换优化法,它首先建立两幅待拼接图像间的变换模型,然后采用非线性迭代最小化算法直接计算出模型的变换参数,从而确定图像的配准位置。该算法效果较好,收敛速度较快,但是它要达到过程的收敛要求有较好的初始估计,如果初始估计不好,则会造成图像拼接的失败。搜索法主要是以一幅图像中的某些特征为依据,在另一幅图像中搜索最佳配准位置,常用的有比值匹配法,块匹配法和网格匹配法。比值匹配法是从一幅图像的重叠区域中部分相邻的两列上取出部分像素,然后以它们的比值作模板,在另一幅图像中搜索最佳匹配。这种算法计算量较小,但精度较低;块匹配法则是以一幅图像重叠区域中的一块作为模板,在另一幅图像中搜索与此模板最相似的匹配块,这种算法精度较高,但计算量过大;网格匹配法减小了块匹配法的计算量,它首先要进行粗匹配,每次水平或垂直移动一个步长,记录最佳匹配位置,然后在此位置附近进行精确匹配,每次步长减半,然后循环此过程直至步长减为0。这种算法较前两种运算量都有所减小,但在实际应用中仍然偏大,而且粗匹配时如果步长取的太大,很可能会造成较大的粗匹配误差,从而很难实现精确匹配。

 




最后

以上就是娇气电话为你收集整理的图像拼接原理与相关技术的全部内容,希望文章能够帮你解决图像拼接原理与相关技术所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(58)

评论列表共有 0 条评论

立即
投稿
返回
顶部