概述
一、光学字符识别(OCR)
光学字符识别(Optical Character Recognition, OCR)这一概念,最早由德国科学家Tausheck在1929年提出。
汉字识别最早是由IBM公司的工程师Casey与Nagy实现的,他们在1966年发表了首篇汉字识别相关的文章,采用的是模板匹配的方式,可以识别1000个印刷体汉字。与此同时,东芝、三洋、松下、富士通等公司也各自在研制印刷体的识别系统。这些系统大多使用基于K-L数字变换的匹配方案,需要大量的专业硬件设备,体积庞大,造价昂贵,所以使用相对有限。
到了20世纪90年代,LeNet5网络的出现开创了深度学习的新纪元,并且在OCR的应用中达到了商用的水平,之后由于种种原因,沉寂了10年。直到2012年,AlexNet网络的出现使得视觉相关的技术进入爆发期,加之此后识别网络和物体检测框架的革新也间接地促进了OCR技术的发展。文字检测领域借鉴了物体检测的经典网络Faster RCNN系列、Yolo系列,发展出一系列文字专用检测技术,如CTPN、TextBox系列、DenseBox等。文字识别领域借鉴了识别网络和序列化网络,演变出以CNN+RNN+CTC以及CNN+RNN+Attention为主流的识别方式。此后,人们逐渐摒弃了传统的字符切割识别方式。
OCR相关著名的会议有:ICDAR(文档分析与识别国际会议)、DAS(文档分析系统国际研讨会)、DPR(文档识别与检索国际会议)、ICPR(模式识别国际会议)、ICFHR(手写识别国际前沿会议)等。除了相关性比较高的、通用类别的视
最后
以上就是神勇柜子为你收集整理的OCR - 关于OCR技术体系的发展的了解的全部内容,希望文章能够帮你解决OCR - 关于OCR技术体系的发展的了解所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复