概述
下载win10下的tesseract的安装包
https://digi.bib.uni-mannheim.de/tesseract/
下载后双击进行安装,这里因为我们要识别中文字符,所以在安装界面中需要进行额外的语言勾选,展开Additional language data
然后点击next安装即可(注意:在选择安装路径的时候不要出现中文,并且要记住这个安装路径)
接下来配置环境变量.路径添加到环境变量中
分别对用户变量PATH和系统变量Path添加刚才的安装目录(我的默认安装在D:Tesseract-OCR)
再在环境变量里创建
在Anaconda Prompt下输入
pip install Pillow5.2.0
pip install pytesseract0.2.4
出现错误:
TesseractError: (1, ‘Error opening data file D:Tesseract-OCR/tessdata/chi_sim.traineddata Please make sure the TESSDATA_PREFIX environment variable is set to your “tessdata” directory. Failed loading language ‘chi_sim’ Tesseract couldn’t load any languages! Could not initialize tesseract.’)
按照
https://blog.csdn.net/qq_38161040/article/details/90727456
方法即可解决
下载 chi_tra.traineddata 文件
最后
以上就是野性小鸭子为你收集整理的win10配置 tesseract 中文字符识别的全部内容,希望文章能够帮你解决win10配置 tesseract 中文字符识别所遇到的程序开发问题。
如果觉得靠谱客网站的内容还不错,欢迎将靠谱客网站推荐给程序员好友。
发表评论 取消回复