[發(fā)明專利]一種基于深度學(xué)習(xí)的OCR檢測(cè)方法在審
| 申請(qǐng)?zhí)枺?/td> | 202010781247.7 | 申請(qǐng)日: | 2020-08-06 |
| 公開(kāi)(公告)號(hào): | CN111967457A | 公開(kāi)(公告)日: | 2020-11-20 |
| 發(fā)明(設(shè)計(jì))人: | 孫余順;鄒易;賴偉海;賴明鐘 | 申請(qǐng)(專利權(quán))人: | 賴明鐘 |
| 主分類號(hào): | G06K9/20 | 分類號(hào): | G06K9/20;G06K9/34;G06K9/62;G06N3/08 |
| 代理公司: | 暫無(wú)信息 | 代理人: | 暫無(wú)信息 |
| 地址: | 361000 福建省*** | 國(guó)省代碼: | 福建;35 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 深度 學(xué)習(xí) ocr 檢測(cè) 方法 | ||
本發(fā)明提供了一種基于深度學(xué)習(xí)的OCR檢測(cè)方法,包括:步驟1:采集待測(cè)字符圖片信息;步驟2:將待測(cè)字符圖片送入字符檢測(cè)網(wǎng)絡(luò)中進(jìn)行單個(gè)字符的位置提取,確定待測(cè)字符圖片中每個(gè)單字符大致的外包矩形區(qū)域;步驟3:根據(jù)待測(cè)字符圖片中的可能字符外包矩形區(qū)域進(jìn)行字符筆畫區(qū)域分割,采集圖片中的字符區(qū)域;步驟4:根據(jù)字符區(qū)域分割的信息,對(duì)字符外包矩形位置進(jìn)行調(diào)整,采集字符區(qū)域內(nèi)各個(gè)字符的準(zhǔn)確外包矩形區(qū)域;步驟5:對(duì)采集到的各個(gè)字符信息進(jìn)行識(shí)別確認(rèn),完成OCR檢測(cè)過(guò)程。本發(fā)明提供了一種通用結(jié)合深度學(xué)習(xí)和傳統(tǒng)算法各自優(yōu)點(diǎn)的方法,很好的解決OCR工業(yè)自動(dòng)化應(yīng)用的挑戰(zhàn)。
技術(shù)領(lǐng)域
本發(fā)明涉及一種OCR檢測(cè)方法,特別涉及一種基于深度學(xué)習(xí)的OCR檢測(cè)方法。
背景技術(shù)
從20世紀(jì)70年代開(kāi)始,光學(xué)字符識(shí)別技術(shù)就已經(jīng)廣泛地應(yīng)用于各種商業(yè)應(yīng)用,現(xiàn)在又開(kāi)始運(yùn)用到自動(dòng)化任務(wù)中,如通行證處理、安全文件處理(支票、財(cái)務(wù)文件、賬單)、郵件追蹤、出版、消費(fèi)品包裝(單號(hào)、批號(hào)、有效期)及臨床應(yīng)用等。
光學(xué)字符識(shí)別(Optical Character Recognition),簡(jiǎn)稱OCR,是一種將圖像內(nèi)的文字,轉(zhuǎn)變成計(jì)算機(jī)文字,進(jìn)而進(jìn)行進(jìn)一步判斷的技術(shù)。OCR主要優(yōu)點(diǎn)在于,它可以以一種讓機(jī)器和肉眼都能識(shí)別的格式對(duì)信息進(jìn)行編碼。
但是當(dāng)前,在工業(yè)自動(dòng)化應(yīng)用中面臨幾個(gè)方面的挑戰(zhàn):
一、工業(yè)字符多種多樣一致性差。比如金屬零件上點(diǎn)刻字符,注塑產(chǎn)品上的浮雕字符,電子元器件上的激光蝕刻字符,噴碼點(diǎn)陣字符等。
二、字符不在一個(gè)平面上。比如瓶蓋或瓶身四周的字符。
三、字符背景復(fù)雜,很多字符印刷在復(fù)雜背景圖案內(nèi)部,字符對(duì)比度低。
四、字符可能存在嚴(yán)重的扭曲、變形、斷裂,粘連等。
傳統(tǒng)的OCR算法對(duì)于上面提到的情況不能識(shí)別或者參數(shù)設(shè)置困難,通用性很差。
隨著深度學(xué)習(xí)技術(shù)的發(fā)展,基于深度學(xué)習(xí)的OCR技術(shù)取得快速的發(fā)展,很多基于深度學(xué)習(xí)的算法已經(jīng)取得很多應(yīng)用,但是和傳統(tǒng)OCR算法一樣,單純基于深度學(xué)習(xí)的算法只能在特定情況下效果較好,通用性依然不好。
發(fā)明內(nèi)容
本發(fā)明提供了一種通用結(jié)合深度學(xué)習(xí)和傳統(tǒng)算法各自優(yōu)點(diǎn)的方法,很好的解決OCR工業(yè)自動(dòng)化應(yīng)用的挑戰(zhàn)。
本發(fā)明提供了一種基于深度學(xué)習(xí)的OCR檢測(cè)方法,包括:
步驟1:采集待測(cè)字符圖片信息;
步驟2:將待測(cè)字符圖片送入字符檢測(cè)網(wǎng)絡(luò)中進(jìn)行單個(gè)字符的位置提取,確定待測(cè)字符圖片中每個(gè)單字符大致的外包矩形區(qū)域;
步驟3:根據(jù)待測(cè)字符圖片中的可能字符外包矩形區(qū)域進(jìn)行字符筆畫區(qū)域分割,采集圖片中的字符區(qū)域;
步驟4:根據(jù)字符區(qū)域分割的信息,對(duì)字符外包矩形位置進(jìn)行調(diào)整,采集字符區(qū)域內(nèi)各個(gè)字符的準(zhǔn)確外包矩形區(qū)域;
步驟5:對(duì)采集到的各個(gè)字符信息進(jìn)行識(shí)別確認(rèn),完成OCR檢測(cè)過(guò)程。
進(jìn)一步地,所述字符檢測(cè)網(wǎng)絡(luò)的訓(xùn)練方法如下:
步驟1:采集字符樣本;
步驟2:對(duì)字符樣本進(jìn)行豐富,并退化處理,送入神經(jīng)網(wǎng)絡(luò);
步驟3:將各個(gè)字符樣本作為同一目標(biāo)類型進(jìn)行訓(xùn)練,得到字符檢測(cè)網(wǎng)絡(luò)。
更進(jìn)一步地,所述退化處理包括對(duì)字符樣本的模擬扭曲、縮放、筆畫粗細(xì)變更、亮度變化、對(duì)比度變化、隨機(jī)位置、隨機(jī)角度調(diào)整。
更進(jìn)一步地,所述模擬扭曲的具體過(guò)程如下:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于賴明鐘,未經(jīng)賴明鐘許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010781247.7/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 根據(jù)用戶學(xué)習(xí)效果動(dòng)態(tài)變化下載學(xué)習(xí)數(shù)據(jù)的系統(tǒng)及方法
- 用于智能個(gè)人化學(xué)習(xí)服務(wù)的方法
- 漸進(jìn)式學(xué)習(xí)管理方法及漸進(jìn)式學(xué)習(xí)系統(tǒng)
- 輔助學(xué)習(xí)的方法及裝置
- 基于人工智能的課程推薦方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 基于強(qiáng)化學(xué)習(xí)的自適應(yīng)移動(dòng)學(xué)習(xí)路徑生成方法
- 一種線上視頻學(xué)習(xí)系統(tǒng)
- 一種基于校園大數(shù)據(jù)的自適應(yīng)學(xué)習(xí)方法、裝置及設(shè)備
- 一種學(xué)習(xí)方案推薦方法、裝置、設(shè)備和存儲(chǔ)介質(zhì)
- 游戲?qū)W習(xí)效果評(píng)測(cè)方法及系統(tǒng)
- OCR文檔識(shí)別方法及其裝置
- 智能調(diào)度多OCR識(shí)別引擎的方法及設(shè)備
- OCR掛接方法、裝置與設(shè)備
- 一種用于教學(xué)系統(tǒng)的OCR識(shí)別方法、裝置和終端
- OCR識(shí)別模型的確定方法及裝置
- 基于聯(lián)邦OCR模型的字符檢測(cè)方法、裝置、設(shè)備和介質(zhì)
- OCR系統(tǒng)的評(píng)估方法、裝置、設(shè)備及可讀存儲(chǔ)介質(zhì)
- OCR模型訓(xùn)練方法、系統(tǒng)及裝置
- 識(shí)別轉(zhuǎn)換圖像文件的方法、系統(tǒng)、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)
- OCR訓(xùn)練數(shù)據(jù)生成方法、裝置、計(jì)算機(jī)設(shè)備及存儲(chǔ)介質(zhì)





