[發明專利]票據識別方法及裝置、電子設備及存儲介質在審
| 申請號: | 201810923451.0 | 申請日: | 2018-08-14 |
| 公開(公告)號: | CN109284750A | 公開(公告)日: | 2019-01-29 |
| 發明(設計)人: | 陳子萍;劉學博;梁鼎 | 申請(專利權)人: | 北京市商湯科技開發有限公司 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20;G06K9/32;G06K9/34 |
| 代理公司: | 北京林達劉知識產權代理事務所(普通合伙) 11277 | 代理人: | 劉新宇 |
| 地址: | 100084 北京市海淀區中*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 票據識別 字符區域 字符內容 存儲介質 電子設備 圖像 票據 模板數據 票據審核 自動識別 字符檢測 字符識別 查驗 | ||
1.一種票據識別方法,其特征在于,包括:
對待識別圖像進行字符檢測,確定所述待識別圖像中的至少一個字符區域;
對所述至少一個字符區域進行字符識別,確定所述至少一個字符區域中的字符內容;
基于所述待識別圖像對應的票據模板數據以及所述至少一個字符區域中的字符內容,得到票據識別結果。
2.根據權利要求1所述的方法,其特征在于,所述對所述至少一個字符區域進行字符識別,確定所述至少一個字符區域中的字符內容,包括:
對水平方向的距離小于第一閾值的至少兩個字符區域進行合并,得到至少一個文本行區域;
對所述至少一個文本行區域進行字符識別,得到所述至少一個文本行區域中的字符內容。
3.根據權利要求2所述的方法,其特征在于,在對所述至少一個文本行區域進行字符識別之前,所述方法還包括:
基于所述至少一個文本行區域中每個文本行區域在水平方向上的尺寸,對所述至少一個文本行區域進行篩選,得到至少一個目標文本行區域;
所述對所述至少一個文本行區域進行字符識別,得到所述至少一個文本行區域中的字符內容,包括:
對所述至少一個目標文本行區域進行字符識別,得到所述至少一個目標文本行區域中每個目標文本行區域的文字內容。
4.根據權利要求2或3所述的方法,其特征在于,所述對所述至少一個文本行區域進行字符識別,得到所述至少一個文本行區域中的字符內容,包括:
對所述文本行區域進行特征提取處理,得到所述文本行區域的特征圖;
對所述特征圖進行解碼處理,得到標簽序列,其中,所述標簽序列包括至少一個標簽,每個標簽對應一個字符;
基于所述標簽序列,獲得所述文本行區域的字符內容。
5.一種票據識別裝置,其特征在于,包括:
字符檢測模塊,用于對待識別圖像進行字符檢測,確定所述待識別圖像中的至少一個字符區域;
字符識別模塊,用于對所述至少一個字符區域進行字符識別,確定所述至少一個字符區域中的字符內容;
第一確定模塊,用于基于所述待識別圖像對應的票據模板數據以及所述至少一個字符區域中的字符內容,得到票據識別結果。
6.根據權利要求5所述的裝置,其特征在于,所述字符識別模塊包括:
第一合并子模塊,用于對水平方向的距離小于第一閾值的至少兩個字符區域進行合并,得到至少一個文本行區域;
字符識別子模塊,用于對所述至少一個文本行區域進行字符識別,得到所述至少一個文本行區域中的字符內容。
7.根據權利要求6所述的裝置,其特征在于,所述裝置還包括:
篩選模塊,用于基于所述至少一個文本行區域中每個文本行區域在水平方向上的尺寸,對所述至少一個文本行區域進行篩選,得到至少一個目標文本行區域;
所述字符識別子模塊用于:
對所述至少一個目標文本行區域進行字符識別,得到所述至少一個目標文本行區域中每個目標文本行區域的文字內容。
8.根據權利要求6或7所述的裝置,其特征在于,所述字符識別子模塊包括:
特征提取單元,用于對所述文本行區域進行特征提取處理,得到所述文本行區域的特征圖;
解碼單元,用于對所述特征圖進行解碼處理,得到標簽序列,其中,所述標簽序列包括至少一個標簽,每個標簽對應一個字符;
獲得單元,用于基于所述標簽序列,獲得所述文本行區域的字符內容。
9.一種電子設備,其特征在于,包括:
處理器;
用于存儲處理器可執行指令的存儲器;
其中,所述處理器被配置為執行權利要求1至4中任意一項所述的方法。
10.一種計算機可讀存儲介質,其上存儲有計算機程序指令,其特征在于,所述計算機程序指令被處理器執行時實現權利要求1至4中任意一項所述的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京市商湯科技開發有限公司,未經北京市商湯科技開發有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810923451.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:精細化圖像識別
- 下一篇:基于頻譜分析和SVM的文字定位的非文本濾除方法





