python 3.7 识别图片
admin
2023-07-16 12:03:54
0

为了把百度文档的内容弄下来,就弄了一下这个

  1. 基本环境
    操作系统:win7 64位系统

python版本:3.7

2.安装配套环境
2.1 首先安装OCR字符识别库Tesseract 下载网址:https://digi.bib.uni-mannheim.de/tesseract/
我下载的是:tesseract-ocr-w64-setup-v4.0.0-beta.4.20180912.exe

2.2 下载后双击进行安装,这里因为我们要识别中文字符,所以在安装界面中需要进行额外的语言勾选,展开Additional language data(这里添加语言可能会出现语言包安装失败,可单独下载语言包,放入安装目录下的tessdata下即可)

python 3.7 识别图片

然后按照下图进行勾选
python 3.7 识别图片

2.3 安装python环境
pip install Pillow
pip install pytesseract

2.4 修改pytesseract.py(在这路径下 python37\Scripts)
tesseract_cmd = 'D:/Program Files (x86)/Tesseract-OCR/tesseract.exe'

3.测试(识别中文的时候,在剪切图片,要让数字稍微大一点,把数字放在图片中心,若识别出来,错别字比较多的话,再重新弄一次图片来识别)
#coding=utf-8
from PIL import Image
import pytesseract
text=pytesseract.image_to_string(Image.open('H:/2.png'),lang='chi_sim')
for i in text.split("\n"):
print(i.replace(" ",""))

报错提示语言包,可在这下面进行下载
https://github.com/tesseract-ocr/tessdata

参考文档:
还有一些关闭了,没有copy到url,可以百度和google,一大堆
https://blog.csdn.net/a519395243/article/details/80447038

相关内容

热门资讯

粉笔张小龙,犯了众怒 在讲台上荒诞“暴走”的张小龙,并不令人意外。6月3日,粉笔创始人张小龙作为主讲嘉宾,应邀出席一所大学...
民进党前秘书长欠台糖公司1.7... 【环球网报道】据台湾中时新闻网报道,民进党前秘书长吴乃仁在担任台糖公司董事长期间,涉及贱卖台糖土地案...
3岁小孩不知妈妈去世,因想念每... “妈妈去国外工作了,很爱你们,只是暂时回不了家。”面对三岁大宝日复一日的寻母思念,湖北武汉的李先生只...
内塔尼亚胡险遭无人机袭击,以媒... 尽管黎以停火协议已达成并开始实施,但零星交火仍在持续。以色列总理内塔尼亚胡刚离开北部边境地区,疑似真...
美媒:拜登家族不肯消失,民主党... 美国将于今年年底举行中期选举,民主党人有望夺回众议院。然而拜登家族的高调举动,使得民主党再次分心,一...
对日本新型军国主义的“新型抗战... 【文/观察者网专栏作者 江宇舟】日本这几个月的对华行为,已经是全方位的恶声、恶气、恶行、恶法:自卫队...
“这里没有口号,只有实干”——... 在黄河科技学院,有这样一个地方:没有惊天动地的口号,没有花里胡哨的“形象工程”,有的只是实验室里彻夜...
AI决定6G成败关键? 专家称... 中经记者 陈佳岚 广州报道 “6G与AI的增强融合,这部分OPPO是全力投入的。而与AI的融合,也是...
自贡:“智造”为核,无人车跑出... 盐都初夏清晨,和勤劳的人们一同早起的,还有一辆辆造型新颖的无人配送车、清扫作业车。市民杨先生对此颇有...
黄仁勋不装了:所有芯片市场我全... 来源:市场资讯 (来源:科技头版) 英伟达要当AI时代唯一的王。 出品 | 科技头版 作者 | 青...