执着战斗机

文章
4
资源
0
加入时间
2年10月24天

使用tesseract-ocr实现验证码识别

tesseract-ocr介绍光学字符识别,是指对图片文件中的文字进行分析识别,获取的过程Tesseract - OCR 引擎最先由HP实验室于1985年开始研发,至1995年时已经成为OCR业内最准确的三款识别引擎之一。然而,HP不久便决定放弃OCR业务,Tesseract也从此尘封数年以后,HP 意识到,与其将Tesseract束之高阁,不如贡献给开源软件业,让其重焕新生在2005年,Tesseract 由美国内华达州信息技术研究所获得,并求诸于 Google 对 Tessera