[發(fā)明專利]文字圖像校正處理方法、裝置、設(shè)備及存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 201811416986.5 | 申請日: | 2018-11-26 |
| 公開(公告)號: | CN109583445A | 公開(公告)日: | 2019-04-05 |
| 發(fā)明(設(shè)計)人: | 周罡 | 申請(專利權(quán))人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32;G06K9/62;G06K9/34 |
| 代理公司: | 深圳眾鼎專利商標代理事務所(普通合伙) 44325 | 代理人: | 黃章輝 |
| 地址: | 518000 廣東省深圳市福田區(qū)福*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 角度檢測 文字圖像 校正處理 檢測圖像 目標文字 校正 卷積神經(jīng)網(wǎng)絡(luò) 存儲介質(zhì) 基礎(chǔ)結(jié)構(gòu) 樣本圖像 預設(shè) 計算機技術(shù)領(lǐng)域 待檢測圖像 框架構(gòu)建 目標圖像 學習 | ||
1.一種文字圖像校正處理方法,其特征在于,所述文字圖像校正處理方法包括:
獲取包含文字和文字傾斜角度的樣本圖像;
基于深度學習框架構(gòu)建預設(shè)的卷積神經(jīng)網(wǎng)絡(luò)基礎(chǔ)結(jié)構(gòu),并使用所述樣本圖像對所述卷積神經(jīng)網(wǎng)絡(luò)基礎(chǔ)結(jié)構(gòu)進行訓練,得到用于檢測圖像中的文字傾斜角度的角度檢測模型;
獲取包含目標文字的待檢測圖像;
在所述角度檢測模型中,對所述待檢測圖像中的目標文字進行傾斜角度的角度檢測,得到所述目標文字的角度檢測結(jié)果;
根據(jù)所述角度檢測結(jié)果,按照預設(shè)的校正方式,對所述待檢測圖像進行校正處理,得到校正后的目標圖像。
2.如權(quán)利要求1所述的文字圖像校正處理方法,其特征在于,所述角度檢測模型包括輸入層、卷積網(wǎng)絡(luò)層、全連接網(wǎng)絡(luò)層和包含四種預設(shè)角度類別定義的分類層,所述在所述角度檢測模型中,對所述待檢測圖像中的目標文字進行傾斜角度的角度檢測,得到所述目標文字的角度檢測結(jié)果包括:
根據(jù)所述角度檢測模型中所述輸入層的定義,對所述待檢測圖像進行預處理,得到預處理后的原始圖像;
根據(jù)所述角度檢測模型中所述卷積網(wǎng)絡(luò)層的定義,對所述原始圖像中的所述目標文字的傾斜角度進行角度特征提取,得到包含角度特征值的所述目標文字的角度特征矩陣;
根據(jù)所述角度檢測模型中所述全連接網(wǎng)絡(luò)層的定義,按照預設(shè)的維度映射條件,對所述角度特征矩陣進行維度映射,得到所述角度特征矩陣對應的四維特征向量,其中,所述四維特征向量中的每個分量的位置對應一種預設(shè)角度類別;
根據(jù)所述角度檢測模型中所述分類層的定義,計算所述四維特征向量的每個所述分量的得分;
選取數(shù)值最大的所述得分對應的所述預設(shè)角度類別的角度值,作為所述目標文字的檢測結(jié)果。
3.如權(quán)利要求2所述的文字圖像校正處理方法,其特征在于,所述根據(jù)所述角度檢測模型中所述輸入層的定義,對所述待檢測圖像進行預處理,得到預處理后的原始圖像包括:
按照預設(shè)的圖像縮放方式,對所述待檢測圖像進行圖像縮放,得到基礎(chǔ)圖像;
將所述基礎(chǔ)圖像,按照預設(shè)的裁剪方式進行圖像裁剪,得到標準圖像;
對所述標準圖像進行去均值和歸一化處理,并將處理后的標準圖像作為所述待檢測圖像的原始圖像。
4.如權(quán)利要求2所述的文字圖像校正處理方法,其特征在于,所述根據(jù)所述角度檢測模型中所述分類層的定義,計算所述四維特征向量的每個所述分量的得分包括:
獲取所述四維特征向量的每個所述分量;
采用如下計算公式,計算所述四維特征向量中每個所述分量的得分p:
其中,xi為所述四維特征向量中的所述分量,i為所述四維特征向量中的第i個分量。
5.如權(quán)利要求1所述的文字圖像校正處理方法,其特征在于,所述根據(jù)所述角度檢測結(jié)果,按照預設(shè)的校正方式,對所述待檢測圖像進行校正處理,得到校正后的目標圖像包括:
以所述待檢測圖像的中心點為軸,按照所述角度檢測結(jié)果中的所述角度值對所述待檢測圖像進行預設(shè)方向的角度旋轉(zhuǎn),得到旋轉(zhuǎn)后的基礎(chǔ)校正圖像;
將所述基礎(chǔ)校正圖像與預設(shè)的空白背景模板進行合成,并將合成后的圖像作為所述目標圖像,其中,所述空白背景模板的大小與所述待檢測圖像的大小相同。
6.一種文字圖像校正處理裝置,其特征在于,所述文字圖像校正處理裝置包括:
樣本獲取模塊,用于獲取包含文字和文字傾斜角度的樣本圖像;
模型訓練模塊,用于基于深度學習框架構(gòu)建預設(shè)的卷積神經(jīng)網(wǎng)絡(luò)基礎(chǔ)結(jié)構(gòu),并使用所述樣本圖像對所述卷積神經(jīng)網(wǎng)絡(luò)基礎(chǔ)結(jié)構(gòu)進行訓練,得到用于檢測圖像中的文字傾斜角度的角度檢測模型;
目標獲取模塊,用于獲取包含目標文字的待檢測圖像;
目標檢測模塊,用于在所述角度檢測模型中,對所述待檢測圖像中的目標文字進行傾斜角度的角度檢測,得到所述目標文字的角度檢測結(jié)果;
圖像校正模塊,用于根據(jù)所述角度檢測結(jié)果,按照預設(shè)的校正方式,對所述待檢測圖像進行校正處理,得到校正后的目標圖像。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于平安科技(深圳)有限公司,未經(jīng)平安科技(深圳)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811416986.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類





