[發(fā)明專利]一種發(fā)票字條自動識別錄入的方法及裝置有效
| 申請?zhí)枺?/td> | 201510416688.6 | 申請日: | 2015-07-15 |
| 公開(公告)號: | CN105005793B | 公開(公告)日: | 2018-02-27 |
| 發(fā)明(設(shè)計)人: | 陳健慶;李錦鵬 | 申請(專利權(quán))人: | 廣州敦和信息技術(shù)有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京聯(lián)瑞聯(lián)豐知識產(chǎn)權(quán)代理事務所(普通合伙)11411 | 代理人: | 曾少麗 |
| 地址: | 510663 廣東省廣州市高新*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 發(fā)票 字條 自動識別 錄入 方法 裝置 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及發(fā)票識別領(lǐng)域,特別涉及一種發(fā)票字條自動識別錄入的方法及裝置。
背景技術(shù)
傳統(tǒng)的發(fā)票錄入方法需要人工打字錄入發(fā)票各種信息,包括抬頭、金額、地址和消費項目等等。這些信息的錄入需要大量時間。對于單位內(nèi)部結(jié)帳,給財務管理都會造成大量不便。隨著智能手機的普及,OCR(光學字符識別)技術(shù)可以大大減輕發(fā)票錄入時間,做到實時報銷等。識別后的結(jié)果還可以進行大數(shù)據(jù)分析,對員工或者客戶的消費習慣進行分析和預測。由于OCR是一種具有挑戰(zhàn)性的算法設(shè)計,目前只能做到對印刷體的識別,對其他的手寫潦草等字體無法識別,手寫潦草等字體還需要人工打字錄入,造成發(fā)票錄入效率較低,另外,OCR對光學攝像頭也有依賴性,光學攝像頭的運動模糊和背景光不足都會對識別結(jié)果造成不利的影響,造成識別效果較差。
發(fā)明內(nèi)容
本發(fā)明要解決的技術(shù)問題在于,針對現(xiàn)有技術(shù)的上述無法識別發(fā)票中手寫潦草字體、發(fā)票錄入效率較低、識別效果較差的缺陷,提供一種能識別發(fā)票中手寫潦草字體、發(fā)票錄入效率較高、識別效果較好的發(fā)票字條自動識別錄入的方法及裝置。
本發(fā)明解決其技術(shù)問題所采用的技術(shù)方案是:構(gòu)造一種發(fā)票字條自動識別錄入的方法,包括如下步驟:
A)建立訓練數(shù)據(jù)庫,采集各種不同格式的發(fā)票圖片,并對每種格式的發(fā)票圖片中的字條標記包圍盒及所屬類別后保存到所述訓練數(shù)據(jù)庫中;
B)接收需要識別的發(fā)票圖片,并自動檢測其位置;所述需要識別的發(fā)票圖片包括多個字條;
C)將所述訓練數(shù)據(jù)庫中的每種格式的發(fā)票圖片中的包圍盒套用到所述需要識別的發(fā)票圖片上面,并采用開源OCR引擎對被所述包圍盒套用的所述需要識別的發(fā)票圖片中的字條進行識別;
D)將所述需要識別的發(fā)票圖片與所述訓練數(shù)據(jù)庫中每種格式的發(fā)票圖片進行格式匹配,并找出格式最匹配的發(fā)票圖片,將所述格式最匹配的發(fā)票圖片的格式作為所述需要識別的發(fā)票圖片的格式;
E)對所述需要識別的發(fā)票圖片中被所述格式最匹配的發(fā)票圖片的包圍盒套用的字條進行圖片分層,得到多個圖層;
F)采用所述開源OCR引擎對每個所述圖層進行識別,計算每個所述圖層的識別分數(shù),并將識別分數(shù)最高的圖層作為濾除公章后的字條。
在本發(fā)明所述的發(fā)票字條自動識別錄入的方法中,所述步驟B)進一步包括:
B1)接收所述需要識別的發(fā)票圖片,并將其轉(zhuǎn)換為圖像矩陣;
B2)利用滑動窗口遍歷所述圖像矩陣,找出所述滑動窗口中最大的點乘值模板作為所述需要識別的發(fā)票圖片的位置。
在本發(fā)明所述的發(fā)票字條自動識別錄入的方法中,所述步驟D)進一步包括:
D1)統(tǒng)計所述訓練數(shù)據(jù)庫中每個字條的字符的出現(xiàn)概率;
D2)分別計算所述需要識別的發(fā)票圖片上被所述包圍盒套用的每個字條中字符的出現(xiàn)次數(shù);
D3)分別計算所述每個字條的字符的出現(xiàn)概率和出現(xiàn)次數(shù)的乘積,并對每個所述乘積求和后除以所述需要識別的發(fā)票圖片中被所述包圍盒套用的字條的數(shù)量,分別得到所述需要識別的發(fā)票圖片與所述訓練數(shù)據(jù)庫中每種格式的發(fā)票圖片的相似度;
D4)找出所述訓練數(shù)據(jù)庫中相似度最大的發(fā)票圖片,并將其作為所述需要識別的發(fā)票圖片的格式。
在本發(fā)明所述的發(fā)票字條自動識別錄入的方法中,所述步驟E)中采用K-均值聚類算法、層次聚類算法和自組織映射圖聚類算法進行圖片分層。
在本發(fā)明所述的發(fā)票字條自動識別錄入的方法中,所述步驟F)進一步包括:
F1)采用所述開源OCR引擎對每個所述圖層進行識別;
F2)計算每個所述圖層中每個字符的出現(xiàn)概率及出現(xiàn)次數(shù);
F3)分別將每個所述圖層中每個字符的出現(xiàn)概率及出現(xiàn)次數(shù)進行相乘,并將乘積求和后分別得到每個圖層的識別分數(shù);
F4)找出識別分數(shù)最高的圖層,并將其作為濾除公章后的字條。
本發(fā)明還涉及一種實現(xiàn)上述發(fā)票字條自動識別錄入的方法的裝置,包括:
訓練數(shù)據(jù)庫建立單元:用于建立訓練數(shù)據(jù)庫,采集各種不同格式的發(fā)票圖片,并對每種格式的發(fā)票圖片中的字條標記包圍盒及所屬類別后保存到所述訓練數(shù)據(jù)庫中;
發(fā)票圖片位置檢測單元:接收需要識別的發(fā)票圖片,并自動檢測其位置;所述需要識別的發(fā)票圖片包括多個字條;
套用識別單元:用于將所述訓練數(shù)據(jù)庫中的每種格式的發(fā)票圖片中的包圍盒套用到所述需要識別的發(fā)票圖片上面,并采用開源OCR引擎對被所述包圍盒套用的所述需要識別的發(fā)票圖片中的字條進行識別;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣州敦和信息技術(shù)有限公司,未經(jīng)廣州敦和信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510416688.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:貴重物品儲運智能標簽
- 下一篇:一種基于視覺背景提取的高速公路車輛檢測方法
- 同類專利
- 專利分類
- 藍牙信息錄入設(shè)備、錄入系統(tǒng)及錄入方法
- 一種原筆跡手寫錄入方法和系統(tǒng)
- 藍牙信息錄入設(shè)備、錄入系統(tǒng)及錄入方法
- 數(shù)據(jù)錄入系統(tǒng)、數(shù)據(jù)錄入方法以及數(shù)據(jù)錄入裝置
- 錄入方法及錄入系統(tǒng)
- 智慧校園系統(tǒng)的信息錄入方法、裝置和計算機可讀存儲介質(zhì)
- 指紋底庫錄入方法、裝置、電子設(shè)備及存儲介質(zhì)
- 一種肺癌患者隨訪系統(tǒng)
- 一種爆破施工填報系統(tǒng)及方法
- 數(shù)據(jù)錄入方法及裝置、設(shè)備、計算機可讀存儲介質(zhì)





