OCR - 关于OCR技术体系的发展的了解

62 阅读 0 评论 41 点赞

我是靠谱客的博主神勇柜子，最近开发中收集的这篇文章主要介绍OCR - 关于OCR技术体系的发展的了解，觉得挺不错的，现在分享给大家，希望可以做个参考。

概述

一、光学字符识别（OCR）

光学字符识别（Optical Character Recognition, OCR）这一概念，最早由德国科学家Tausheck在1929年提出。

汉字识别最早是由IBM公司的工程师Casey与Nagy实现的，他们在1966年发表了首篇汉字识别相关的文章，采用的是模板匹配的方式，可以识别1000个印刷体汉字。与此同时，东芝、三洋、松下、富士通等公司也各自在研制印刷体的识别系统。这些系统大多使用基于K-L数字变换的匹配方案，需要大量的专业硬件设备，体积庞大，造价昂贵，所以使用相对有限。

到了20世纪90年代，LeNet5网络的出现开创了深度学习的新纪元，并且在OCR的应用中达到了商用的水平，之后由于种种原因，沉寂了10年。直到2012年，AlexNet网络的出现使得视觉相关的技术进入爆发期，加之此后识别网络和物体检测框架的革新也间接地促进了OCR技术的发展。文字检测领域借鉴了物体检测的经典网络Faster RCNN系列、Yolo系列，发展出一系列文字专用检测技术，如CTPN、TextBox系列、DenseBox等。文字识别领域借鉴了识别网络和序列化网络，演变出以CNN+RNN+CTC以及CNN+RNN+Attention为主流的识别方式。此后，人们逐渐摒弃了传统的字符切割识别方式。

OCR相关著名的会议有：ICDAR（文档分析与识别国际会议）、DAS（文档分析系统国际研讨会）、DPR（文档识别与检索国际会议）、ICPR（模式识别国际会议）、ICFHR（手写识别国际前沿会议）等。除了相关性比较高的、通用类别的视