[發(fā)明專(zhuān)利]一種基于tesseract引擎的文字識(shí)別方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 201711172950.2 | 申請(qǐng)日: | 2017-11-22 |
| 公開(kāi)(公告)號(hào): | CN107862312A | 公開(kāi)(公告)日: | 2018-03-30 |
| 發(fā)明(設(shè)計(jì))人: | 朱秋華 | 申請(qǐng)(專(zhuān)利權(quán))人: | 朱秋華 |
| 主分類(lèi)號(hào): | G06K9/20 | 分類(lèi)號(hào): | G06K9/20;G06K9/62;G06N3/04;G06N3/08;G06F17/30 |
| 代理公司: | 北京遠(yuǎn)智匯知識(shí)產(chǎn)權(quán)代理有限公司11659 | 代理人: | 徐鵬飛 |
| 地址: | 214000 江蘇省無(wú)*** | 國(guó)省代碼: | 江蘇;32 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 tesseract 引擎 文字 識(shí)別 方法 裝置 設(shè)備 存儲(chǔ) 介質(zhì) | ||
技術(shù)領(lǐng)域
本發(fā)明實(shí)施例涉及文字識(shí)別技術(shù)領(lǐng)域,尤其涉及一種基于tesseract引擎的文字識(shí)別方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)。
背景技術(shù)
OCR(Optical Character Recognition,光學(xué)字符識(shí)別)技術(shù)是通過(guò)掃描等光學(xué)輸入方式將各種票據(jù)、報(bào)刊、書(shū)籍、文稿及其它印刷品的文字轉(zhuǎn)化為圖像信息,再利用文字識(shí)別技術(shù)將圖像信息轉(zhuǎn)化為可以使用的計(jì)算機(jī)輸入技術(shù),可應(yīng)用于銀行票據(jù)、大量文字資料、檔案卷宗、文案的錄入和處理領(lǐng)域。
傳統(tǒng)的OCR文字識(shí)別方法,如tesseract引擎,相對(duì)云端服務(wù)器的OCR服務(wù)來(lái)說(shuō)識(shí)別率較低,且對(duì)圖片的質(zhì)量要求比較高。現(xiàn)在也存在通過(guò)tesseract引擎和云端服務(wù)器共同識(shí)別文字的技術(shù),該技術(shù)首先使用tesseract引擎查詢(xún)本地文字庫(kù),該本地文字庫(kù)通過(guò)tesseract引擎訓(xùn)練得到,尋找是否存在與待識(shí)別圖片相匹配的識(shí)別結(jié)果,若存在,則輸出識(shí)別結(jié)果;若不存在,則通過(guò)卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)進(jìn)行文字識(shí)別并輸出識(shí)別結(jié)果。 CNN是一種前饋神經(jīng)網(wǎng)絡(luò),它的人工神經(jīng)元可以響應(yīng)一部分覆蓋范圍內(nèi)的周?chē)鷨卧瑢?duì)于大型圖像處理有出色表現(xiàn)。但是上述識(shí)別方法中的本地文字庫(kù)識(shí)別精度不高,用戶(hù)獲取識(shí)別結(jié)果后還需要手動(dòng)更正識(shí)別結(jié)果來(lái)更新本地文字庫(kù),因此識(shí)別效率比較低。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提出一種基于tesseract引擎的文字識(shí)別方法、裝置、設(shè)備及存儲(chǔ)介質(zhì),在輸出識(shí)別結(jié)果前采用tesseract引擎和云服務(wù)端共同訓(xùn)練本地文字庫(kù),同時(shí)tesseract引擎模塊采用雙識(shí)別引擎來(lái)識(shí)別文字,從而提高文字識(shí)別的準(zhǔn)確率和識(shí)別效率。
第一方面,本發(fā)明實(shí)施例提供了一種基于tesseract引擎的文字識(shí)別方法,包括:
S110、獲取待識(shí)別圖片;
S120、將所述待識(shí)別圖片傳輸至tesseract引擎模塊和云端服務(wù)器,所述 tesseract引擎模塊和云端服務(wù)器同時(shí)對(duì)所述待識(shí)別圖片進(jìn)行文字識(shí)別獲取兩個(gè)識(shí)別結(jié)果,如果所述兩個(gè)識(shí)別結(jié)果相同則對(duì)所述待識(shí)別圖片中的文字進(jìn)行識(shí)別,如果所述兩個(gè)識(shí)別結(jié)果不同,則將所述待識(shí)別圖片和待識(shí)別圖片對(duì)于的來(lái)自云端服務(wù)器的識(shí)別結(jié)果存入本地文字庫(kù);
S130、重復(fù)上述步驟直至完成所述本地文字庫(kù)的升級(jí);
S140、采用所述tesseract引擎模塊對(duì)所述待識(shí)別圖片中的文字進(jìn)行識(shí)別,采用輪廓筆畫(huà)描述作為文字識(shí)別的第一識(shí)別引擎,采用邊角特征數(shù)據(jù)庫(kù)作為第二識(shí)別引擎;
所述tesseract引擎模塊首先查詢(xún)所述本地文字庫(kù),尋找是否存在與所述待識(shí)別圖片相匹配的識(shí)別結(jié)果,若存在,則以文字的形式輸出本地文字庫(kù)中存儲(chǔ)的識(shí)別結(jié)果;若不存在,則通過(guò)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行文字識(shí)別,并以文字的形式輸出識(shí)別結(jié)果。
第二方面,本發(fā)明實(shí)施例還提供了一種文字識(shí)別裝置,該裝置包括:
圖片獲取模塊,用于獲取待識(shí)別圖片;
本地文字庫(kù)訓(xùn)練模塊,用于將所述待識(shí)別圖片傳輸至tesseract引擎模塊和云端服務(wù)器,所述tesseract引擎模塊和云端服務(wù)器同時(shí)對(duì)所述待識(shí)別圖片進(jìn)行文字識(shí)別獲取兩個(gè)識(shí)別結(jié)果,如果所述兩個(gè)識(shí)別結(jié)果相同則啟動(dòng)識(shí)別結(jié)果輸出模塊,如果所述兩個(gè)識(shí)別結(jié)果不同,則將所述待識(shí)別圖片和待識(shí)別圖片對(duì)于的來(lái)自云端服務(wù)器的識(shí)別結(jié)果存入本地文字庫(kù);
本地文字庫(kù)升級(jí)模塊,用于重復(fù)上述步驟直至完成所述本地文字庫(kù)的升級(jí);
文字識(shí)別模塊,用于采用所述tesseract引擎模塊對(duì)所述待識(shí)別圖片中的文字進(jìn)行識(shí)別,采用輪廓筆畫(huà)描述作為文字識(shí)別的第一識(shí)別引擎,采用邊角特征數(shù)據(jù)庫(kù)作為第二識(shí)別引擎;
識(shí)別結(jié)果輸出模塊,用于所述tesseract引擎模塊首先查詢(xún)所述本地文字庫(kù),尋找是否存在與所述待識(shí)別圖片相匹配的識(shí)別結(jié)果,若存在,則以文字的形式輸出本地文字庫(kù)中存儲(chǔ)的識(shí)別結(jié)果;若不存在,則通過(guò)卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行文字識(shí)別,并以文字的形式輸出識(shí)別結(jié)果。
第三方面,本發(fā)明實(shí)施例還提供了一種文字識(shí)別設(shè)備,該設(shè)備包括:
一個(gè)或多個(gè)處理器;
存儲(chǔ)裝置,用于存儲(chǔ)一個(gè)或多個(gè)程序;
當(dāng)所述一個(gè)或多個(gè)程序被所述一個(gè)或多個(gè)處理器執(zhí)行,使得所述一個(gè)或多個(gè)處理器實(shí)現(xiàn)上述所涉及的任一所述的基于tesseract引擎的文字識(shí)別方法。
第四方面,本發(fā)明實(shí)施例還提供了一種計(jì)算機(jī)存儲(chǔ)介質(zhì),其上存儲(chǔ)有計(jì)算機(jī)程序,該程序被處理器執(zhí)行時(shí)實(shí)現(xiàn)上述所涉及的任一所述的基于tesseract引擎的文字識(shí)別方法。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于朱秋華,未經(jīng)朱秋華許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711172950.2/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 一種基于tesseract引擎的文字識(shí)別方法及裝置
- 一種基于tesseract引擎的文字識(shí)別方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 智能電力表計(jì)抄錄計(jì)算系統(tǒng)及方法
- 驗(yàn)證碼識(shí)別方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- 基于tesseract引擎的圖片敏感詞檢測(cè)和定位方法和裝置
- 一種基于深度學(xué)習(xí)的信用卡檢測(cè)和數(shù)字識(shí)別方法
- 基于tesseract-ocr的pdf文件解析方法
- 多功能小夜燈(TESSERACT3)
- 一種基于tesseract的變電站端子排識(shí)別方法及系統(tǒng)
- 一種基于Tesseract-OCR的飛機(jī)主顯示器PFD中空速標(biāo)尺的識(shí)別方法





