//簡單的東西玩了一天...很尷尬
0.工具
- PIL py的圖片處理庫
- pytesseract
- tesseract-ocr
下載地址:http://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-setup-3.05.00dev.exe
安裝完成后要把路徑寫入Path
like this:
寫入Path
1.代碼
try:
import Image
except ImportError:
from PIL import Image
import pytesseract
image = Image.open('./pic/c_e_test.jpg')
code = pytesseract.image_to_string(image)
print('\n\n\n'+code)
2.圖片要求
純英文的,因為默認語言包是識別英文語言包.同時英文的識別率基本上100%.
- 更換中文語言包
下載地址
https://github.com/tesseract-ocr/tesseract/wiki/Data-Files#special-data-files
下載完成后找到以下目錄替換原文件
image.png
3.其他
這次遇到了一個大坑 關于權限問題
由于我用SSD沒分區 全部文件在C盤導致有些需要管理員權限的無法調用
這個時候只能用管理員DOS手動運行程序
so.裝系統要分區!!!!