目錄
- 簡介
- 步驟
- 安裝百度AI庫
- 注冊百度AI開放平臺
- 調用glob庫
- 調用AipOcr庫識別文字
- 批量操作
- 總結
簡介
Python免費調用百度AI實現(xiàn)圖片上面的文字識別
步驟
安裝百度AI庫
注冊百度AI開放平臺
先注冊百度AI,獲得ID和密鑰。注冊方法可參考:注冊方法 只需走到 “1.6 獲取密鑰” 即可。然后記錄下自己的APP_ID、API_KEY、SECRET_KEY,就可以開始了。
調用glob庫
glob庫用于獲得指定路徑下的指定后綴的文件,圖片使用的是《數學模型》pdf掃描版,部分如下:
import glob
path = "數學模型\\"
glob.glob(path+"*.png")
指定文件夾中的指定的.png后綴的文件,全部提取出來了:
選取第一張圖片 “數學模型1.png” 做測試:
files = glob.glob(path+"*.png")
file = files[0]
調用AipOcr庫識別文字
導入AipOcr模塊,這個模塊是用于做文字識別的(OCR即Optical Character Recognition,光學字符識別)。填入你申請的ID和KEY,client = AipOcr()
是固定寫法。先用二進制方式rb打開,然后讀取,再調用百度AI進行識別,并將識別結果存入message變量。
from aip import AipOcr #導入AipOcr模塊,用于做文字識別
import glob
APP_ID = '*********' # 你申請的
API_KEY = '*********'# 你申請的
SECRET_KEY = '*********'# 你申請的
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
pic = open(file,'rb')# 以二進制(rb)打開
img = pic.read() # 讀取
message = client.basicGeneral(img) # 調用百度AI識別圖片中的文字
查看message參數,結果如下:
可見,message參數的結果為 “大字典” 形式,其中的鍵 words_result
所對應的值為一個 “大列表” ,這個列表里又有很多鍵值對,鍵都是words,值就是AI從圖片上識別出來的內容。使用語句message['words_result'][0...n]['words']
可以篩選出該頁的標題:
message['words_result'][1]['words']
for循環(huán)逐行提取:
for words in message['words_result']:
word = words['words'] # 提取文字
print(word)
識別效果圖:
識別也不是完美的,有很多識別錯誤與未識別出的文字。當然,原圖字體越清晰,識別度越高。
可能會遇到的問題
識別過程中可能會遇到類似識別錯誤(無法識別)問題,原因是未領取免費識別次數,解決過程如下:
百度OCR API識別失?。篛pen api qps request limit reached 錯誤 解決方法
幾個月前,用Python寫了個小工具,主要是用到了百度的OCR API做了個文字識別的小工具,前面一直能用,然而今天,在使用的時候,報錯了。
錯誤如下:Open api qps request limit reached
最后終于找到了解決方法,原來,現(xiàn)在要自己去領取免費的測試額度了?。。?/p>
領取免費測試額度的地址:(或者你在你原來那個調用的那個項目里也可以找到免費領取測試額度,見下圖)
https://console.bce.baidu.com/ai/#/ai/ocr/overview/resource/getFree
領取完之后,還是用原來項目的appID,apiKey,secretKey即可。
然后等領取額度到賬后,重新運行就行了。
批量操作
批量操作的核心為for循環(huán),txt_file = open('數學模型.txt', 'a')
指打開名字為“數學模型”的文本文件(若不存在則自動新建),模式為添加模式,即'a'模式。添加模式是指,如果文本中已經有一些內容,則接著往下寫,不會影響原來的內容。如果是'w'模式,則會將之前的內容全部覆蓋。然后遍歷待處理的圖片,逐個處理:
from aip import AipOcr #導入AipOcr模塊,用于做文字識別
import glob
APP_ID = '*********' # 你申請的
API_KEY = '*********'# 你申請的
SECRET_KEY = '*********'# 你申請的
client = AipOcr(APP_ID, API_KEY, SECRET_KEY)
path = "數學模型\\"
files = glob.glob(path+"*.png")
txt_file = open('數學模型.txt', 'a')
for file in files:
pic = open(file,'rb')# 以二進制(rb)打開
img = pic.read() # 讀取
message = client.basicGeneral(img) # 調用百度AI識別圖片中的文字
for words in message['words_result']:
word = words['words'] # 提取文字
print(word)
txt_file.write(word) # 將文字寫入文本文件
txt_file.close() # 關閉文本文件
總結
到此這篇關于Python調用百度AI實現(xiàn)圖片上文字識別功能的文章就介紹到這了,更多相關Python圖片上文字識別內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!
您可能感興趣的文章:- Python基于百度AI的文字識別的示例
- python利用百度AI實現(xiàn)文字識別功能
- Python3調用百度AI識別圖片中的文字功能示例【測試可用】
- Python基于百度AI實現(xiàn)OCR文字識別
- python調用百度AI接口實現(xiàn)人流量統(tǒng)計
- python 使用百度AI接口進行人臉對比的步驟
- Python基于百度AI實現(xiàn)抓取表情包
- python 百度aip實現(xiàn)文字識別的實現(xiàn)示例
- Python調用百度AI實現(xiàn)圖片上表格識別功能