[發明專利]一種圖像中文字的識別方法、裝置、介質及電子設備在審
| 申請號: | 202110176821.0 | 申請日: | 2021-02-09 |
| 公開(公告)號: | CN112801085A | 公開(公告)日: | 2021-05-14 |
| 發明(設計)人: | 馮煜博;徐嬌;王廣普 | 申請(專利權)人: | 沈陽麟龍科技股份有限公司 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20;G06K9/62;G06N3/08;G06N3/04 |
| 代理公司: | 北京國昊天誠知識產權代理有限公司 11315 | 代理人: | 南霆 |
| 地址: | 110117 遼寧省*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 圖像 文字 識別 方法 裝置 介質 電子設備 | ||
1.一種圖像中文字的識別方法,其特征在于,所述方法包括:
獲取待識別的文字圖像區域;
若所述待識別的文字圖像區域中包含文字,則提取文字特征;
將所述文字特征輸入至預訓練語言模型,用于供所述預訓練語言模型對各文字進行預測,得到文字預測結果;其中,所述預訓練語言模型是基于預先構建的有遮蓋訓練樣本進行訓練得到的;
將所述文字預測結果作為圖像中文字的識別結果。
2.根據權利要求1所述的方法,其特征在于,提取文字特征,包括:
使用由卷積神經網絡和池化層構成的特征提取層,提取待識別圖像的文字特征。
3.根據權利要求2所述的方法,其特征在于,使用由卷積層和池化層構成的特征提取層,提取待識別圖像的文字特征,包括:
使用卷積神經網絡對所述待識別圖像進行特征提取,得到特征映射;
使用池化層對提取到的特征映射進行最大池化,得到精煉特征映射;
將所述精煉特征映射轉化為特征序列。
4.根據權利要求3所述的方法,其特征在于,在將所述精煉特征映射轉化為特征序列之前所述方法還包括:
對所述精煉特征映射進行歸一化處理,得到歸一化結果;
相應的,將所述精煉特征映射轉化為特征序列,包括:
將所述歸一化結果轉化為特征序列。
5.根據權利要求1所述的方法,其特征在于,所述預訓練語言模型的訓練過程包括:
獲取有遮蓋訓練樣本;所述有遮蓋訓練樣本包括單個文字的部分遮蓋和/或全部遮蓋;
將所述訓練樣本劃分為訓練集和測試集;
采用所述訓練集的訓練樣本輸入至初始網絡模型進行模型訓練,以通過上下文對當前預測文字的關聯系數,預測當前文字;
若所述初始網絡模型經過測試集的訓練樣本測試后,滿足預設條件,則將所述初始網絡模型確定為預訓練語言模型。
6.一種圖像中文字的識別裝置,其特征在于,所述裝置包括:
文字圖像區域獲取模塊,用于獲取待識別的文字圖像區域;
文字特征提取模塊,用于若所述待識別的文字圖像區域中包含文字,則提取文字特征;
文字預測結果確定模塊,用于將所述文字特征輸入至預訓練語言模型,用于供所述預訓練語言模型對各文字進行預測,得到文字預測結果;其中,所述預訓練語言模型是基于預先構建的有遮蓋訓練樣本進行訓練得到的;
識別結果確定模塊,用于將所述文字預測結果作為圖像中文字的識別結果。
7.根據權利要求6所述的裝置,其特征在于,所述文字特征提取模塊,包括:
特征提取單元,用于使用由卷積神經網絡和池化層構成的特征提取層,提取待識別圖像的文字特征。
8.根據權利要求7所述的裝置,其特征在于,特征提取單元,具體用于:
使用卷積神經網絡對所述待識別圖像進行特征提取,得到特征映射;
使用池化層對提取到的特征映射進行最大池化,得到精煉特征映射;
將所述精煉特征映射轉化為特征序列。
9.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,該程序被處理器執行時實現如權利要求1-5中任一所述的圖像中文字的識別方法。
10.一種電子設備,包括存儲器,處理器及存儲在存儲器上并可在處理器運行的計算機程序,其特征在于,所述處理器執行所述計算機程序時實現如權利要求1-5中任一所述的圖像中文字的識別方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于沈陽麟龍科技股份有限公司,未經沈陽麟龍科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110176821.0/1.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





