[發明專利]營業執照識別方法和裝置有效
| 申請號: | 201710067058.1 | 申請日: | 2017-02-07 |
| 公開(公告)號: | CN108399405B | 公開(公告)日: | 2023-06-27 |
| 發明(設計)人: | 張睿欣;郭曉威 | 申請(專利權)人: | 騰訊科技(上海)有限公司 |
| 主分類號: | G06V30/19 | 分類號: | G06V30/19;G06V30/262;G06V10/764;G06V10/82;G06N3/0442;G06N3/048;G06N3/08 |
| 代理公司: | 華進聯合專利商標代理有限公司 44224 | 代理人: | 何平;鄧云鵬 |
| 地址: | 201200 上海*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 營業執照 識別 方法 裝置 | ||
1.一種營業執照識別方法,包括:
獲取包含營業執照完整信息的圖片;
從所述圖片中提取所述營業執照的文本候選區域,所述文本候選區域是指所述營業執照中包含文本信息的各個區域;
獲取基準文本行,所述基準文本行為所述營業執照中的位置固定的文本行;
通過所述基準文本行的長度和寬度比判定所述基準文本行中包含的字符個數,并根據所述字符個數結合所述基準文本行的位置從所述文本候選區域中篩選得到文本關鍵信息區域;
對所述文本關鍵信息區域進行光學字符識別得到識別結果;
對所述識別結果進行語義修復得到修正后的識別結果,所述修正后的識別結果包括所述營業執照中的關鍵信息。
2.根據權利要求1所述的方法,其特征在于,所述從所述圖片中提取所述營業執照的文本候選區域,包括:
對所述圖片進行梯度、二值化和圖形學操作處理得到所述營業執照的文本候選區域。
3.根據權利要求1所述的方法,其特征在于,所述對所述文本關鍵信息區域進行光學字符識別得到識別結果,包括:
對所述文本關鍵信息區域的文本行進行過切分,得到所述文本行中各個單字符;
將所述文本行中各個單字符進行光學字符識別得到所述單字符的識別結果及對應的置信度;
將各個單字符的識別結果按照在所述文本行中所處的位置組成字符串,得到所述文本行的初始識別結果,以及獲取所述文本行中單字符的識別結果對應的最小置信度,將所述最小置信度作為所述文本行的置信度;
若所述文本行的置信度大于置信度閾值,則所述文本行的初始識別結果作為所述文本行的識別結果。
4.根據權利要求1所述的方法,其特征在于,所述對所述文本關鍵信息區域進行光學字符識別得到識別結果,包括:
采用時間遞歸神經網絡模型對所述文本關鍵信息區域中文本行進行不切分的光學字符識別得到所述文本行的識別結果。
5.根據權利要求1至4中任一項所述的方法,其特征在于,所述對所述識別結果進行語義修復得到修正后的識別結果,包括:
對所述識別結果中的號碼進行校驗,以及對所述識別結果中的文字進行糾正,得到修正后的識別結果,所述修正后的識別結果包括所述營業執照中的關鍵信息。
6.一種營業執照識別裝置,其特征在于,包括:
圖片獲取模塊,用于獲取包含營業執照完整信息的圖片;
文本提取模塊,用于從所述圖片中提取所述營業執照的文本候選區域,所述文本候選區域是指所述營業執照中包含文本信息的各個區域;
關鍵信息區域獲取模塊,用于獲取基準文本行,所述基準文本行為所述營業執照中的位置固定的文本行;通過所述基準文本行的長度和寬度比判定所述基準文本行中包含的字符個數,并根據所述字符個數結合所述基準文本行的位置從所述文本候選區域中篩選得到文本關鍵信息區域;
文本識別模塊,用于對所述文本關鍵信息區域進行光學字符識別得到識別結果;
修正模塊,用于對所述識別結果進行語義修復得到修正后的識別結果,所述修正后的識別結果包括所述營業執照中的關鍵信息。
7.根據權利要求6所述的裝置,其特征在于,所述文本提取模塊還用于對所述圖片進行梯度、二值化和圖形學操作處理得到所述營業執照的文本候選區域。
8.根據權利要求6所述的裝置,其特征在于,所述文本識別模塊還用于對所述文本關鍵信息區域的文本行進行過切分,得到所述文本行中各個單字符;將所述文本行中各個單字符進行光學字符識別得到所述單字符的識別結果及對應的置信度;將各個單字符的識別結果按照在所述文本行中所處的位置組成字符串,得到所述文本行的初始識別結果,以及獲取所述文本行中單字符的識別結果對應的最小置信度,將所述最小置信度作為所述文本行的置信度;若所述文本行的置信度大于置信度閾值,則所述文本行的初始識別結果作為所述文本行的識別結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(上海)有限公司,未經騰訊科技(上海)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710067058.1/1.html,轉載請聲明來源鉆瓜專利網。





