tesseract-ocr 图片文字识别

331 阅读 0 评论 219 点赞

我是靠谱客的博主懵懂万宝路，这篇文章主要介绍tesseract-ocr 图片文字识别，现在分享给大家，希望可以做个参考。

本篇记录下python识别图片中的文字所需的安装配置；

安装库：

pip install pytesseract

pip install PILLOW

安装 Tesseract-OCR软件：

Tesseract-OCR这个软件是由Google维护的开源的OCR软件。

下载地址：https://github.com/tesseract-ocr/tesseract/wiki/Downloads

下载后安装后，将Tesseract-OCR路径加入系统path；

安装时注意勾选简体中文，默认安装，安装完毕后，敲命令（看看装的怎么样了，支持什么语言）：

tesseract

tesseract -v

tesseract --list-langs　　#查看Tesseract-OCR支持语言

中文字库chi_sim.traineddata

下载地址：https://github.com/tesseract-ocr/tesseract/wiki/Data-Files

将中文字库放在Tesseract-OCRtessdata文件夹里面；

改文件：

C:Python3Libsite-packagespytesseractpytesseract.py（根据实际路径修改），找到这两行：

# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY
tesseract_cmd = 'tesseract'

改为这样：

# CHANGE THIS IF TESSERACT IS NOT IN YOUR PATH, OR IS NAMED DIFFERENTLY
#tesseract_cmd = 'tesseract'
tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract.exe'

代码：

（写几个字，截图保存成：1.png）

import pytesseract
from PIL import Image
text = pytesseract.image_to_string(Image.open('1.png'), lang='chi_sim')
print(text)

转载于:https://www.cnblogs.com/feiyueNotes/p/8407099.html

最后

以上就是懵懂万宝路最近收集整理的关于tesseract-ocr 图片文字识别的全部内容，更多相关tesseract-ocr内容请搜索靠谱客的其他文章。

本图文内容来源于网友提供，作为学习参考使用，或来自网络收集整理，版权属于原作者所有。

本文分类：python
浏览次数：331 次浏览
发布日期：2024-01-12 07:26:12

tesseract-ocr 图片文字识别

最后

评论列表共有 0 条评论

发表评论取消回复

tesseract-ocr 图片文字识别

最后

相关文章

评论列表共有 0 条评论

发表评论 取消回复

发表评论取消回复