我是靠谱客的博主 野性小鸭子,最近开发中收集的这篇文章主要介绍win10配置 tesseract 中文字符识别,觉得挺不错的,现在分享给大家,希望可以做个参考。

概述

下载win10下的tesseract的安装包

https://digi.bib.uni-mannheim.de/tesseract/

在这里插入图片描述
下载后双击进行安装,这里因为我们要识别中文字符,所以在安装界面中需要进行额外的语言勾选,展开Additional language data
在这里插入图片描述

然后点击next安装即可(注意:在选择安装路径的时候不要出现中文,并且要记住这个安装路径)

接下来配置环境变量.路径添加到环境变量中

分别对用户变量PATH和系统变量Path添加刚才的安装目录(我的默认安装在D:Tesseract-OCR)

再在环境变量里创建
在这里插入图片描述

在Anaconda Prompt下输入
pip install Pillow5.2.0
pip install pytesseract
0.2.4

出现错误:
TesseractError: (1, ‘Error opening data file D:Tesseract-OCR/tessdata/chi_sim.traineddata Please make sure the TESSDATA_PREFIX environment variable is set to your “tessdata” directory. Failed loading language ‘chi_sim’ Tesseract couldn’t load any languages! Could not initialize tesseract.’)

在这里插入图片描述
按照
https://blog.csdn.net/qq_38161040/article/details/90727456
方法即可解决
下载 chi_tra.traineddata 文件

最后

以上就是野性小鸭子为你收集整理的win10配置 tesseract 中文字符识别的全部内容,希望文章能够帮你解决win10配置 tesseract 中文字符识别所遇到的程序开发问题。

如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。

本图文内容来源于网友提供,作为学习参考使用,或来自网络收集整理,版权属于原作者所有。
点赞(39)

评论列表共有 0 条评论

立即
投稿
返回
顶部