[發明專利]字符識別方法及相關產品在審
| 申請號: | 201811267148.6 | 申請日: | 2018-10-29 |
| 公開(公告)號: | CN109583449A | 公開(公告)日: | 2019-04-05 |
| 發明(設計)人: | 龔敏;何其佳;禹世杰;楊威 | 申請(專利權)人: | 深圳市華尊科技股份有限公司 |
| 主分類號: | G06K9/34 | 分類號: | G06K9/34 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 郝傳鑫;熊永強 |
| 地址: | 518000 廣東省深圳市福田*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 文字分割 字符識別 回歸 目標圖像 輸入圖像 文本區域 文本 候選框 特征集 矯正 預處理 金字塔網絡 分支網絡 復雜環境 候選網絡 目標字符 特征提取 語義分割 預設定 準確率 預設 網絡 | ||
本發明實施例提供了字符識別方法及相關產品,所述方法包括:獲取輸入圖像;對所述輸入圖像進行預處理,得到目標圖像;基于特征金字塔網絡FPN對所述目標圖像進行特征提取,得到特征集,基于區域候選網絡RPN對所述特征集進行處理,得到多個文本區域候選框;將所述多個文本區域候選框輸入到預設定位網絡,得到多個文本回歸框,每一文本回歸框包括四個頂點;將所述多個文本回歸框輸入到語義分割分支網絡,得到多個文字分割圖;對所述多文字分割圖輸入到預設角度回歸網絡,得到多個文字分割圖的角度,并對每一文字分割圖的角度進行矯正;對矯正后的所述多個文字分割圖進行識別,得到目標字符。采用本發明實施例能夠針對復雜環境,提升字符識別準確率。
技術領域
本發明涉及字符識別技術領域,具體涉及一種字符識別方法及相關產品。
背景技術
目前,利用圖像識別(image identification)技術識別圖像中包含的特定字符被應用于眾多領域。例如,在一種示例性場景中,用戶通過用戶設備掃描獲得某目標圖像,并識別該目標圖像中是否包含特定字符,例如,識別廣告牌中的漢字,但是,在字體角度不正的情況下,字符識別準確率較低,降低了用戶體驗。
發明內容
本發明實施例提供了一種字符識別方法及相關產品,能夠提高字符識別準確率。
本發明實施例第一方面提供了一種字符識別方法,包括:
獲取輸入圖像;
對所述輸入圖像進行預處理,得到目標圖像;
基于特征金字塔網絡FPN對所述目標圖像進行特征提取,得到特征集,基于區域候選網絡RPN對所述特征集進行處理,得到多個文本區域候選框;
將所述多個文本區域候選框輸入到預設定位網絡,得到多個文本回歸框,每一文本回歸框包括四個頂點;
將所述多個文本回歸框輸入到語義分割分支網絡,得到多個文字分割圖;
對所述多個文字分割圖輸入到預設角度回歸網絡,得到多個文字分割圖的角度,并對每一文字分割圖的角度進行矯正;
對矯正后的所述多個文字分割圖進行識別,得到目標字符。
本發明實施例第二方面提供了一種字符識別裝置,包括:
獲取單元,用于獲取輸入圖像;
預處理單元,用于對所述輸入圖像進行預處理,得到目標圖像;
處理單元,用于基于特征金字塔網絡FPN對所述目標圖像進行特征提取,得到特征集,基于區域候選網絡RPN對所述特征集進行處理,得到多個文本區域候選框;
定位單元,用于將所述多個文本區域候選框輸入到預設定位網絡,得到多個文本回歸框,每一文本回歸框包括四個頂點;
分割單元,用于將所述多個文本回歸框輸入到語義分割分支網絡,得到多個文字分割圖;
矯正單元,用于對所述多個文字分割圖輸入到預設角度回歸網絡,得到多個文字分割圖的角度,并對每一文字分割圖的角度進行矯正;
識別單元,用于對矯正后的所述多個文字分割圖進行識別,得到目標字符。
第三方面,本申請實施例提供了一種電子設備,包括:處理器和存儲器;以及一個或多個程序,所述一個或多個程序被存儲在所述存儲器中,并且被配置成由所述處理器執行,所述程序包括用于如第一方面中所描述的部分或全部步驟的指令。
第四方面,本申請實施例提供了一種計算機可讀存儲介質,其中,所述計算機可讀存儲介質用于存儲計算機程序,其中,所述計算機程序使得計算機執行如本申請實施例第一方面中所描述的部分或全部步驟的指令。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市華尊科技股份有限公司,未經深圳市華尊科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811267148.6/2.html,轉載請聲明來源鉆瓜專利網。





