[發明專利]光學字符識別方法、裝置和電子設備在審
| 申請號: | 202011513721.4 | 申請日: | 2020-12-18 |
| 公開(公告)號: | CN112488094A | 公開(公告)日: | 2021-03-12 |
| 發明(設計)人: | 盧永晨 | 申請(專利權)人: | 北京字節跳動網絡技術有限公司 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20;G06K9/62 |
| 代理公司: | 泰和泰律師事務所 51219 | 代理人: | 祝海燕 |
| 地址: | 100041 北京市石景山區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 光學 字符 識別 方法 裝置 電子設備 | ||
1.一種光學字符識別方法,其特征在于,包括:
獲取第一字符圖像,其中,所述第一字符圖像包括至少兩個字符元素;
對所述第一字符圖像進行分類,生成分類結果,其中,所述分類結果包括字符元素在字符圖像方向的排布方向,所述字符圖像方向用于指示具有語意聯系的相鄰字符之間的位置關系,所述排布方向用于指示字符元素按照語意的走向;
基于所述分類結果和所述第一字符圖像,生成第二字符圖像;
對所述第二字符圖像進行光學字符識別,得到識別結果。
2.根據權利要求1所述的方法,其特征在于,所述第一字符圖像中字符圖像方向包括行方向或者列方向。
3.根據權利要求2所述的方法,其特征在于,所述對所述第一字符圖像進行分類,生成分類結果,包括:
將所述第一字符圖像導入預先建立的第一分類模型,得到第一排布方向。
4.根據權利要求3所述的方法,其特征在于,所述基于所述分類結果和所述第一字符圖像,生成第二字符圖像,包括:
響應于所述第一排布方向指示預設逆方向,將所述第一字符圖像轉動至所述預設正方向,得到所述第二字符圖像。
5.根據權利要求4所述的方法,其特征在于,所述對所述第二字符圖像進行光學字符識別,得到識別結果,包括:
將所述第二字符圖像導入預先建立的第一字符識別模型,得到所述識別結果,其中,所述第一字符識別模型的訓練樣本集包括行方向樣本和列方向樣本。
6.根據權利要求2所述的方法,其特征在于,所述對所述第一字符圖像進行分類,生成分類結果,包括:
將所述第一字符圖像導入預先建立的第二分類模型,得到字符圖像方向信息和第二排布方向。
7.根據權利要求6所述的方法,其特征在于,所述基于所述分類結果和所述第一字符圖像,生成第二字符圖像,包括:
響應于所述第二排布方向指示預設逆方向,將所述第一字符圖像轉動至所述預設正方向,得到所述第二字符圖像。
8.根據權利要求7所述的方法,其特征在于,所述對所述第二字符圖像進行光學字符識別,得到識別結果,包括:
響應于所述字符圖像方向信息指示行方向,將所述第二字符圖像導入預先建立的第二字符識別模型,得到所述識別結果,其中,所述第二字符識別模型的訓練樣本集包括行方向樣本;
響應于所述字符圖像方向信息指示列方向,將所述第二字符圖像導入預先建立的第三字符識別模型,得到所述識別結果,其中,所述第三字符識別模型的訓練樣本集包括列方向樣本。
9.一種光學字符識別裝置,其特征在于,包括:
獲取單元,用于獲取第一字符圖像,其中,所述第一字符圖像包括至少兩個字符元素;
分類單元,用于對所述第一字符圖像進行分類,生成分類結果,其中,所述分類結果包括字符元素在字符圖像方向的排布方向,所述字符圖像方向用于指示具有語意聯系的相鄰字符之間的位置關系,所述排布方向用于指示字符元素按照語意的走向;
生成單元,用于基于所述分類結果和所述第一字符圖像,生成第二字符圖像;
識別單元,用于對所述第二字符圖像進行光學字符識別,得到識別結果。
10.一種電子設備,其特征在于,包括:
一個或多個處理器;
存儲裝置,用于存儲一個或多個程序,
當所述一個或多個程序被所述一個或多個處理器執行,使得所述一個或多個處理器實現如權利要求1-8中任一所述的方法。
11.一種計算機可讀介質,其上存儲有計算機程序,其特征在于,該程序被處理器執行時實現如權利要求1-8中任一所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京字節跳動網絡技術有限公司,未經北京字節跳動網絡技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011513721.4/1.html,轉載請聲明來源鉆瓜專利網。





