文章詳情頁(yè)

小白學(xué)Python之實(shí)現(xiàn)OCR識(shí)別

瀏覽：3日期：2022-08-06 15:58:04

目錄前期準(zhǔn)備界面編寫截圖功能實(shí)現(xiàn)OCR實(shí)現(xiàn)內(nèi)容顯示總結(jié)前期準(zhǔn)備

在這個(gè)階段主要準(zhǔn)備整個(gè)小程序的結(jié)構(gòu)，既然要實(shí)現(xiàn)ocr，那么輸入就是一張圖片，而圖片這里采用屏幕截圖的方式獲得，輸出是文字，這里采用搜狗的ocr接口，我們把截好的圖片傳到搜狗ocr接口中，然后把返回的文字作為輸出即可。

由于想做一個(gè)小程序，所以要為程序做GUI，這里采用tkinter編制GUI界面。

界面編寫

界面主要就準(zhǔn)備一個(gè)窗體，里面有菜單，給出OCR功能。

小白學(xué)Python之實(shí)現(xiàn)OCR識(shí)別

之后我們點(diǎn)擊菜單，則啟動(dòng)一個(gè)截圖功能，在截圖完成后，我們就把截得的圖片傳入ocr接口并返回文字到主窗體中。

小白學(xué)Python之實(shí)現(xiàn)OCR識(shí)別

主面板的編寫則直接使用tkinter建立菜單等

root = Tk() root.title('小新的OCR')# 創(chuàng)建一個(gè)頂級(jí)菜單 menubar = Menu(root) # 創(chuàng)建一個(gè)下拉菜單“文件”，然后將它添加到頂級(jí)菜單中 filemenu = Menu(menubar, tearoff=False) filemenu.add_command(label='OCR', command=buttonCaptureClick, accelerator=’Ctrl+N’) filemenu.add_command(label='幫助',command=helpClick) filemenu.add_command(label='退出', command=root.quit) menubar.add_cascade(label='操作', menu=filemenu) # 顯示菜單 root.config(menu=menubar) root.bind_all('<Control-d>', lambda event: buttonCaptureClick()) #啟動(dòng)消息主循環(huán) root.mainloop()

這樣變回產(chǎn)生一個(gè)窗體，用戶可以和這個(gè)窗體進(jìn)行交互，你可以點(diǎn)擊菜單，然后找到其子菜單中的OCR一項(xiàng)，點(diǎn)擊它便會(huì)調(diào)用一個(gè)buttonCaptureClick的函數(shù)，這個(gè)函數(shù)就來產(chǎn)生截圖，并且保存截圖。

截圖功能實(shí)現(xiàn)

截圖功能我也是參考網(wǎng)上的內(nèi)容，原理就是先把整個(gè)屏幕給捕捉到，然后監(jiān)聽鼠標(biāo)事件，當(dāng)鼠標(biāo)左邊按下則作為截圖的左頂點(diǎn)，鼠標(biāo)左鍵松下則最為截圖的右底點(diǎn)，這樣我們截圖區(qū)域就出來了，然后進(jìn)行保存即可。

#用來顯示全屏幕截圖并響應(yīng)二次截圖的窗口類class MyCapture: def __init__(self, png):#變量X和Y用來記錄鼠標(biāo)左鍵按下的位置self.X = tkinter.IntVar(value=0)self.Y = tkinter.IntVar(value=0)#屏幕尺寸screenWidth = root.winfo_screenwidth()screenHeight = root.winfo_screenheight()#創(chuàng)建頂級(jí)組件容器self.top = tkinter.Toplevel(root, width=screenWidth, height=screenHeight)#不顯示最大化、最小化按鈕self.top.overrideredirect(True)self.canvas = tkinter.Canvas(self.top,bg=’white’, width=screenWidth, height=screenHeight)#顯示全屏截圖，在全屏截圖上進(jìn)行區(qū)域截圖self.image = tkinter.PhotoImage(file=png)self.text =''self.canvas.create_image(screenWidth//2, screenHeight//2, image=self.image)#鼠標(biāo)左鍵按下的位置def onLeftButtonDown(event): self.X.set(event.x) self.Y.set(event.y) #開始截圖 self.sel = Trueself.canvas.bind(’<Button-1>’, onLeftButtonDown)#鼠標(biāo)左鍵移動(dòng)，顯示選取的區(qū)域def onLeftButtonMove(event): if not self.sel:return global lastDraw try:#刪除剛畫完的圖形，要不然鼠標(biāo)移動(dòng)的時(shí)候是黑乎乎的一片矩形self.canvas.delete(lastDraw) except Exception as e:pass lastDraw = self.canvas.create_rectangle(self.X.get(), self.Y.get(), event.x, event.y, outline=’black’)self.canvas.bind(’<B1-Motion>’, onLeftButtonMove)#獲取鼠標(biāo)左鍵抬起的位置，保存區(qū)域截圖def onLeftButtonUp(event): self.sel = False try:self.canvas.delete(lastDraw) except Exception as e:pass sleep(0.1) #考慮鼠標(biāo)左鍵從右下方按下而從左上方抬起的截圖 left, right = sorted([self.X.get(), event.x]) top, bottom = sorted([self.Y.get(), event.y]) pic = ImageGrab.grab((left+1, top+1, right, bottom)) fileName ='temp.jpg' pic.save(fileName) self.text = get_text(fileName) #關(guān)閉當(dāng)前窗口 self.top.destroy()self.canvas.bind(’<ButtonRelease-1>’, onLeftButtonUp)#讓canvas充滿窗口，并隨窗口自動(dòng)適應(yīng)大小self.canvas.pack(fill=tkinter.BOTH, expand=tkinter.YES) #開始截圖def buttonCaptureClick(): #最小化主窗口# root.state(’icon’) root.withdraw() sleep(0.4) filename = ’temp.png’ #grab()方法默認(rèn)對(duì)全屏幕進(jìn)行截圖 im = ImageGrab.grab() im.save(filename) im.close() #顯示全屏幕截圖 w = MyCapture(filename) root.wait_window(w.top) #截圖結(jié)束，恢復(fù)主窗口，并刪除臨時(shí)的全屏幕截圖文件 root.update() root.deiconify() text1.config(state = NORMAL) text1.delete(0.0,END) text1.insert(’insert’,w.text) text1.config(state = DISABLED) text1.pack() os.remove(filename)OCR實(shí)現(xiàn)

因?yàn)镺CR其實(shí)是采用了搜狗的接口，所以需要做的工作也不是很多，只需要把我們的圖片傳入即可。

def get_text(img_path): print('') img = img_path # 圖片路徑 files = {'pic_path': open(img, 'rb')} # files # 類似data數(shù)據(jù) url = 'http://pic.sogou.com/pic/upload_pic.jsp' # post的url keywords = requests.post(url, files=files).text # requests 提交圖片 url = 'http://pic.sogou.com/pic/ocr/ocrOnline.jsp?query=' + keywords # keywords就是圖片url此方式為get請(qǐng)求 ocrResult = requests.get(url).json() # 直接轉(zhuǎn)換為json格式contents = ocrResult[’result’] # 類似字典把result的value值取出來是一個(gè)list然后里面很多json就是識(shí)別的文字 text = '' for content in contents: # 遍歷所有結(jié)果text+=(content[’content’].strip()+’n’) # strip去除空格他返回的結(jié)果自帶一個(gè)換行 return text內(nèi)容顯示

內(nèi)容顯示是在截圖結(jié)束后我們把ocr識(shí)別的內(nèi)容存儲(chǔ)起來

self.text = get_text(fileName)

然后再顯示到主窗體上

text1.config(state = NORMAL) text1.delete(0.0,END) text1.insert(’insert’,w.text) text1.config(state = DISABLED) text1.pack() 總結(jié)

雖然是一個(gè)完整的項(xiàng)目，但是其中的很多模塊其實(shí)都是借用其他人的模塊，而我做的只是把他們結(jié)合起來做成一個(gè)小項(xiàng)目，所以是站在巨人的肩膀上開發(fā)。

到此這篇關(guān)于Python實(shí)現(xiàn)OCR識(shí)別的文章就介紹到這了,更多相關(guān)Python實(shí)現(xiàn)OCR識(shí)別內(nèi)容請(qǐng)搜索好吧啦網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持好吧啦網(wǎng)！

參考：

https://cloud.tencent.com/developer/article/1097904 https://morvanzhou.github.io/tutorials/python-basic/tkinter/ https://www.52pojie.cn/thread-708177-1-1.html

Python 編程

上一條：Python OpenCV實(shí)現(xiàn)視頻追蹤下一條：python使用py2neo查詢Neo4j的節(jié)點(diǎn)、關(guān)系及路徑

相關(guān)文章：

1. 告別AJAX實(shí)現(xiàn)無刷新提交表單2. Xml簡(jiǎn)介_動(dòng)力節(jié)點(diǎn)Java學(xué)院整理3. Vue+elementUI下拉框自定義顏色選擇器方式4. 使用css實(shí)現(xiàn)全兼容tooltip提示框5. css進(jìn)階學(xué)習(xí) 選擇符6. 低版本IE正常運(yùn)行HTML5+CSS3網(wǎng)站的3種解決方案7. CSS hack用法案例詳解8. 詳解盒子端CSS動(dòng)畫性能提升9. CSS3實(shí)例分享之多重背景的實(shí)現(xiàn)(Multiple backgrounds)10. 小技巧處理div內(nèi)容溢出

排行榜

					
					10個(gè)技巧，讓你在 2017 年成為更好的Node開發(fā)者
如何手寫簡(jiǎn)易的 Vue Router
關(guān)于Java JDK安裝、配置環(huán)境變量的問題
python 實(shí)現(xiàn)倒計(jì)時(shí)功能(gui界面)
el-table表格動(dòng)態(tài)合并相同數(shù)據(jù)單元格(可指定列+自定義合并)
一個(gè) 2 年 Android 開發(fā)者的 18 條忠告
如何用python實(shí)現(xiàn)一個(gè)HTTP連接池
使用Django實(shí)現(xiàn)把兩個(gè)模型類的數(shù)據(jù)聚合在一起
小技巧處理div內(nèi)容溢出
Django 解決model 反向引用中的related_name問題
詳解盒子端CSS動(dòng)畫性能提升