[發明專利]一種發票字條自動識別錄入的方法及裝置有效
| 申請號: | 201510416688.6 | 申請日: | 2015-07-15 |
| 公開(公告)號: | CN105005793B | 公開(公告)日: | 2018-02-27 |
| 發明(設計)人: | 陳健慶;李錦鵬 | 申請(專利權)人: | 廣州敦和信息技術有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京聯瑞聯豐知識產權代理事務所(普通合伙)11411 | 代理人: | 曾少麗 |
| 地址: | 510663 廣東省廣州市高新*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 發票 字條 自動識別 錄入 方法 裝置 | ||
1.一種發票字條自動識別錄入的方法,其特征在于,包括如下步驟:
A)建立訓練數據庫,采集各種不同格式的發票圖片,并對每種格式的發票圖片中的字條標記包圍盒及所屬類別后保存到所述訓練數據庫中;
B)接收需要識別的發票圖片,并自動檢測其位置;所述需要識別的發票圖片包括多個字條;
C)將所述訓練數據庫中的每種格式的發票圖片中的包圍盒套用到所述需要識別的發票圖片上面,并采用開源OCR引擎對被所述包圍盒套用的所述需要識別的發票圖片中的字條進行識別;
D)將所述需要識別的發票圖片與所述訓練數據庫中每種格式的發票圖片進行格式匹配,并找出格式最匹配的發票圖片,將所述格式最匹配的發票圖片的格式作為所述需要識別的發票圖片的格式;
E)對所述需要識別的發票圖片中被所述格式最匹配的發票圖片的包圍盒套用的字條進行圖片分層,得到多個圖層;
F)采用所述開源OCR引擎對每個所述圖層進行識別,計算每個所述圖層的識別分數,并將識別分數最高的圖層作為濾除公章后的字條。
2.根據權利要求1所述的發票字條自動識別錄入的方法,其特征在于,所述步驟B)進一步包括:
B1)接收所述需要識別的發票圖片,并將其轉換為圖像矩陣;
B2)利用滑動窗口遍歷所述圖像矩陣,找出所述滑動窗口中最大的點乘值模板作為所述需要識別的發票圖片的位置。
3.根據權利要求1或2所述的發票字條自動識別錄入的方法,其特征在于,所述步驟D)進一步包括:
D1)統計所述訓練數據庫中每個字條的字符的出現概率;
D2)分別計算所述需要識別的發票圖片上被所述包圍盒套用的每個字條中字符的出現次數;
D3)分別計算所述每個字條的字符的出現概率和出現次數的乘積,并對每個所述乘積求和后除以所述需要識別的發票圖片中被所述包圍盒套用的字條的數量,分別得到所述需要識別的發票圖片與所述訓練數據庫中每種格式的發票圖片的相似度;
D4)找出所述訓練數據庫中相似度最大的發票圖片,并將其作為所述需要識別的發票圖片的格式。
4.根據權利要求1或2所述的發票字條自動識別錄入的方法,其特征在于,所述步驟E)中采用K-均值聚類算法、層次聚類算法和自組織映射圖聚類算法進行圖片分層。
5.根據權利要求1或2所述的發票字條自動識別錄入的方法,其特征在于,所述步驟F)進一步包括:
F1)采用所述開源OCR引擎對每個所述圖層進行識別;
F2)計算每個所述圖層中每個字符的出現概率及出現次數;
F3)分別將每個所述圖層中每個字符的出現概率及出現次數進行相乘,并將乘積求和后分別得到每個圖層的識別分數;
F4)找出識別分數最高的圖層,并將其作為濾除公章后的字條。
6.一種實現如權利要求1所述的發票字條自動識別錄入的方法的裝置,其特征在于,包括:
訓練數據庫建立單元:用于建立訓練數據庫,采集各種不同格式的發票圖片,并對每種格式的發票圖片中的字條標記包圍盒及所屬類別后保存到所述訓練數據庫中;
發票圖片位置檢測單元:接收需要識別的發票圖片,并自動檢測其位置;所述需要識別的發票圖片包括多個字條;
套用識別單元:用于將所述訓練數據庫中的每種格式的發票圖片中的包圍盒套用到所述需要識別的發票圖片上面,并采用開源OCR引擎對被所述包圍盒套用的所述需要識別的發票圖片中的字條進行識別;
格式匹配單元:用于將所述需要識別的發票圖片與所述訓練數據庫中每種格式的發票圖片進行格式匹配,并找出格式最匹配的發票圖片,將所述格式最匹配的發票圖片的格式作為所述需要識別的發票圖片的格式;
圖片分層單元:用于對所述需要識別的發票圖片中被所述格式最匹配的發票圖片的包圍盒套用的字條進行圖片分層,得到多個圖層;
公章過濾單元:用于采用所述開源OCR引擎對每個所述圖層進行識別,計算每個所述圖層的識別分數,并將識別分數最高的圖層作為濾除公章后的字條。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州敦和信息技術有限公司,未經廣州敦和信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510416688.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:貴重物品儲運智能標簽
- 下一篇:一種基于視覺背景提取的高速公路車輛檢測方法





