[發明專利]字符識別處理方法和裝置有效
| 申請號: | 202011506446.3 | 申請日: | 2020-12-18 |
| 公開(公告)號: | CN112508003B | 公開(公告)日: | 2023-10-13 |
| 發明(設計)人: | 呂鵬原;章成全 | 申請(專利權)人: | 北京百度網訊科技有限公司 |
| 主分類號: | G06V30/14 | 分類號: | G06V30/14;G06V30/146;G06V30/148;G06V30/19;G06V10/82;G06N3/0464;G06N3/08 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 韓海花 |
| 地址: | 100085 北京市*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 字符 識別 處理 方法 裝置 | ||
1.一種字符識別處理方法,其特征在于,包括:
對樣本圖片集合中每張圖片里的字符標注字符區域;
標注與每個所述字符區域對應的字符類別和字符位置編碼;
根據所述標注字符區域的所述樣本圖片集合,以及與每個所述字符區域對應的字符類別和字符位置編碼,訓練預設的用于字符識別的神經網絡模型。
2.如權利要求1所述的方法,其中,所述對樣本圖片集合中每張圖片里的字符標注字符區域,包括:
獲取所述每張圖片里與每個字符相對應的字符框的位置坐標;
根據預設的收縮比率和所述位置坐標對所述字符框進行收縮處理,根據縮放后的字符框位置坐標標注所述字符區域。
3.如權利要求1所述的方法,其中,所述標注與每個所述字符區域對應的所述字符類別,包括:
為每個所述字符區域中的像素點賦值為所述字符區域中字符類別預設的索引值。
4.如權利要求1所述的方法,其中,所述標注與每個所述字符區域對應的所述字符位置編碼,包括:
獲取預設的字符串長度閾值;
獲取每個所述字符區域的位置索引值;
按照預設算法對所述字符串長度閾值和所述位置索引值進行計算,根據計算結果標注每個所述字符區域對應的所述字符位置編碼。
5.如權利要求1-4任一所述的方法,還包括:
獲取待識別的目標圖片;
根據所述神經網絡模型對所述目標圖片進行處理,獲取預測字符以及與每個所述預測字符對應的字符位置編碼;
根據與每個所述預測字符對應的字符位置編碼對所述預測字符進行排序,生成目標字符。
6.一種字符識別處理裝置,包括:
第一標注模塊,用于對樣本圖片集合中每張圖片里的字符標注字符區域;
第二標注模塊,用于標注與每個所述字符區域對應的字符類別和字符位置編碼;
訓練模塊,用于根據所述標注字符區域的所述樣本圖片集合,以及與每個所述字符區域對應的字符類別和字符位置編碼,訓練預設的用于字符識別的神經網絡模型。
7.如權利要求6所述的裝置,其中,所述第一標注模塊,具體用于:
獲取所述每張圖片里與每個字符相對應的字符框的位置坐標;
根據預設的收縮比率和所述位置坐標對所述字符框進行收縮處理,根據縮放后的字符框位置坐標標注所述字符區域。
8.如權利要求6所述的裝置,其中,所述第二標注模塊,具體用于:
為每個所述字符區域中的像素點賦值為所述字符區域中字符類別預設的索引值。
9.如權利要求1所述的裝置,其中,所述第二標注模塊,具體用于:獲取預設的字符串長度閾值;
獲取每個所述字符區域的位置索引值;
按照預設算法對所述字符串長度閾值和所述位置索引值進行計算,根據計算結果標注每個所述字符區域對應的所述字符位置編碼。
10.如權利要求6所述的裝置,還包括:
第一獲取模塊,用于獲取待識別的目標圖片;
第二獲取模塊,用于根據所述神經網絡模型對所述目標圖片進行處理,獲取預測字符以及與每個所述預測字符對應的字符位置編碼;
排序模塊,用于根據與每個所述預測字符對應的字符位置編碼對所述預測字符進行排序,生成目標字符。
11.一種電子設備,其特征在于,包括:
至少一個處理器;以及
與所述至少一個處理器通信連接的存儲器;其中,
所述存儲器存儲有可被所述至少一個處理器執行的指令,所述指令被所述至少一個處理器執行,以使所述至少一個處理器能夠執行權利要求1-5中任一項所述的字符識別處理方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百度網訊科技有限公司,未經北京百度網訊科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011506446.3/1.html,轉載請聲明來源鉆瓜專利網。





