概述
参与到计算机视觉行业近两年来,第一次仔细认真的回过头看自己做的究竟是什么东西。在过去的工作中,不管是在学校还是在单位,拿到项目了,就照着自己所要达到的目的去查找资料,阅读文献,然后就是写代码。大大小小的项目经历了这么多,做完一个,开心,以前学的一些图像处理方面的知识,现在也好多没用到,没用到的自然就忘了,该系统的回顾一下了!后面要做好这些工作,还将回顾一下自己所熟知的几个方向,加油!!下面就简单介绍一下相关的东西以及Marr提出的视觉系统框架:
计算机视觉理解的任务:低层的图像处理、高层的图像理解。
低层:图像压缩、噪声滤波、图像锐化等预处理方法。
高层:取决于知识、目标以及如何达到目标,主要用的人工智能的方法。高层计算机视觉:模仿人类的认知和根据包含在图像中的信息进行决策的能力。
计算机视觉是建立在高层处理的基础上的,认知过程与图像内容的先验知识是紧密结合在一起的。
低层计算机视觉技术几乎与数字图像处理完全重合。边缘提取是该阶段一个典型的处理例子。
低层图像处理与高层计算机视觉的区别在于所使用的数据。低层数据由原始图像构成,表现为亮度或灰度值构成的矩阵;而高层数据虽然也来源于图像,但是只有那些与高层目标有关的数据被提取出来,很大程度上减少数据量。高层数据表示了有关图像内容的知识。
Marr认为,视觉系统的任务是对环境中三维物体进行识别、定位与运动分析。
视觉系统研究的三层次:计算理论层次、表达与算法层次、硬件实现层次
1)计算理论层次:回答系统各个部分的计算目的与计算策略,亦即各个部分的输入输出是什么,之间的关系是什么变换或是具有什么约束。输入是二维图像,输入是由二维图像“重建”出来的三维物体的位置与形状。
2)表达与算法层次:视觉系统的研究给出各个部分的输入、输出和内部的信息表达,以及实现计算理论所规定的目标的算法。
3)硬件层次:如何用硬件实现以上算法。
视觉信息处理的三阶段:
1)构成所谓“要素图”或“基元图”,基元图由二维图像中的边缘点、直线段、顶点、纹理等基本几何或特征组成;
2)对环境2.5维的描述,即部分的、不完整的三维形状与位置。以观察者坐标系下描述的部分三维物体形状,称为2.5维描述。包括立体视觉、运动分析、由灰度恢复表面形状等处理单元。
3)由2.5维描述得到物体完整的三维描述,而且是在物体本身某一固定坐标系下的描述。
图像处理与机器视觉
图像处理系统的功能包括:增强、编码、压缩、复原与重构。
图像增强:图像增强系统所执行操作的结果是使人们觉得处理后的图像质量更好。如对比度增强、亮度放缩、边缘锐化等。
图像编码:编码使研究图像信息的表达方式,使其更经济与有效,这包括量化方法、冗余消除。编码还可能包括研究图像信息的表达方式,使其在传输或存储图像中出现错误时仍具有鲁棒性。
图像压缩:目的在于减少存储与传输图像的比特数量。
图像复原:对图像中的错误进行修改。如添加一个确定性的模糊操作,随机噪声等。
图像重构:指若干局部图像重构成一幅完整图像的过程。
机器视觉:机器对图像进行自动处理并报告图像中有什么的过程。包括:特征度量、基于特征的模式识别
特征度量:从图像中提取一组度量,以表示整幅图像或某些组成的特点。
模式分类:对度量作出决策的过程,即给定一个未知物体的某个度量或一组度量。
模式识别:对未知物体进行分类。
最后
以上就是虚拟芒果为你收集整理的图像处理与机器视觉的主要任务的全部内容,希望文章能够帮你解决图像处理与机器视觉的主要任务所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复