文章詳情頁

如何使用Python進(jìn)行PDF圖片識別OCR

瀏覽：4日期：2022-06-29 11:54:07

使用場景

使用圖片識別可以快速提取圖片中的信息，方便高效。

Python并不能直接對PDF進(jìn)行識別，所以如果是識別PDF的話，需要先將PDF轉(zhuǎn)化為圖片，然后再進(jìn)行識別。

必備工具 Python

可以安裝3.7及以上版本

tesseract-ocr

下載地址： https://github.com/UB-Mannheim/tesseract/wiki 使用最新版本即可

需要用到的庫

pip install pillowpip install opencv-pythonpip install fitzpip install PyMuPDFpip install pytesseract代碼示例

from PIL import Imageimport osimport pytesseract import cv2 as cvimport fitzdef pdf_image(pdfPath,imgPath,zoom_x,zoom_y,rotation_angle): # 打開PDF文件 pdf = fitz.open(pdfPath) # 逐頁讀取PDF for pg in range(0, pdf.pageCount): page = pdf[pg] # 設(shè)置縮放和旋轉(zhuǎn)系數(shù) trans = fitz.Matrix(zoom_x, zoom_y).preRotate(rotation_angle) pm = page.getPixmap(matrix=trans, alpha=False) # 開始寫圖像 pm.writePNG(imgPath+str(pg)+'.png') #pm.writePNG(imgPath) pdf.close()pdf_path =’D:/123.pdf’img_path =’D:/123.png’pdf_image(pdf_path,img_path,5,5,0)# 依賴opencvimg=cv.imread(img_path)text=pytesseract.image_to_string(Image.fromarray(img),lang=’chi_tra’)# 不依賴opencv寫法# text=pytesseract.image_to_string(Image.open(img_path))print(text)總結(jié)

識別清晰的文字圖片的時候準(zhǔn)確率非常高

但是識別手寫體的話效果不太好

注意事項

在安裝tesseract-ocr 的時候一定要記得選擇對應(yīng)的語言，不然是無法正常使用的。

以上就是如何使用Python進(jìn)行PDF圖片識別OCR的詳細(xì)內(nèi)容，更多關(guān)于python pdf圖片識別ocr的資料請關(guān)注好吧啦網(wǎng)其它相關(guān)文章！

Python 編程

上一條：python將YUV420P文件轉(zhuǎn)PNG圖片格式的兩種方法下一條：python實現(xiàn)簡單的井字棋游戲(gui界面)

相關(guān)文章：

1. CSS hack用法案例詳解2. css進(jìn)階學(xué)習(xí) 選擇符3. CSS Hack大全-教你如何區(qū)分出IE6-IE10、FireFox、Chrome、Opera4. 使用css實現(xiàn)全兼容tooltip提示框5. 低版本IE正常運(yùn)行HTML5+CSS3網(wǎng)站的3種解決方案6. 使用純HTML的通用數(shù)據(jù)管理和服務(wù)7. css代碼優(yōu)化的12個技巧8. 告別AJAX實現(xiàn)無刷新提交表單9. HTML DOM setInterval和clearInterval方法案例詳解10. CSS3實例分享之多重背景的實現(xiàn)(Multiple backgrounds)

排行榜

					
					一個 2 年 Android 開發(fā)者的 18 條忠告
一份萬網(wǎng)的PHP筆試題及答案
如何手寫簡易的 Vue Router
Spring使用AspectJ的注解式實現(xiàn)AOP面向切面編程
Android根據(jù)包名停止其他應(yīng)用程序的方法
Django 解決model 反向引用中的related_name問題
Django一小時寫出賬號密碼管理系統(tǒng)
Django自定義列表 models字段顯示方式
idea 找不到符號或找不到包的幾種解決方法
如何在jsp界面中插入圖片
ASP基礎(chǔ)入門第三篇(ASP腳本基礎(chǔ))