[發(fā)明專利]基于插件的發(fā)票識(shí)別方法有效
| 申請(qǐng)?zhí)枺?/td> | 201710506334.X | 申請(qǐng)日: | 2017-06-28 |
| 公開(公告)號(hào): | CN107358232B | 公開(公告)日: | 2020-12-29 |
| 發(fā)明(設(shè)計(jì))人: | 衣楊;趙小蕾;王玉娟;石曉紅 | 申請(qǐng)(專利權(quán))人: | 中山大學(xué)新華學(xué)院 |
| 主分類號(hào): | G06K9/32 | 分類號(hào): | G06K9/32;G06K9/34 |
| 代理公司: | 廣州匯航專利代理事務(wù)所(普通合伙) 44537 | 代理人: | 呂詩(shī) |
| 地址: | 510520 廣東*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 插件 發(fā)票 識(shí)別 方法 | ||
1.一種基于插件的發(fā)票識(shí)別方法,其特征是,包括:
將預(yù)先創(chuàng)建的識(shí)別插件導(dǎo)入到動(dòng)態(tài)鏈接庫(kù)中;其中,所述識(shí)別插件基于適應(yīng)于對(duì)應(yīng)類型的發(fā)票的識(shí)別算法創(chuàng)建;
獲取待識(shí)別的發(fā)票的圖像信息,及其類型;
根據(jù)該待識(shí)別的發(fā)票的類型從所述動(dòng)態(tài)鏈接庫(kù)中調(diào)取對(duì)應(yīng)的識(shí)別插件以對(duì)該待識(shí)別的發(fā)票的圖像信息進(jìn)行識(shí)別,進(jìn)而獲取所需的發(fā)票信息;
所述識(shí)別方法 包括:
S21、通過(guò)色彩分離將發(fā)票中的表格從圖像中進(jìn)行分離,對(duì)分離出的表格圖像進(jìn)行二值化,用形態(tài)學(xué)操作對(duì)表格進(jìn)行修復(fù)以獲取完整的表格;
S22、對(duì)步驟S21獲取的表格進(jìn)行Hough變換,求其直線傾斜角度,根據(jù)傾斜角度對(duì)發(fā)票原始彩色圖像和表格圖像進(jìn)行旋轉(zhuǎn);
S23、采用投影法對(duì)表格中各個(gè)角點(diǎn)坐標(biāo)進(jìn)行定位,并根據(jù)定位結(jié)果對(duì)表格進(jìn)行切割,以獲取表格中的多個(gè)不同的信息區(qū)域;
投影分為水平投影與垂直投影;水平投影包括:對(duì)發(fā)票表格上的五條水平直線進(jìn)行積分,能夠得到對(duì)應(yīng)X坐標(biāo),即可得到五條水平直線在表格圖像中的縱坐標(biāo)R1、R2、R3、R4和R5;
垂直投影包括:把發(fā)票表格中第二條與第三條水平直線之間的部分截取出來(lái),然后再進(jìn)行垂直投影,得到九個(gè)明顯的峰值,設(shè)從左到右垂直直線的橫坐標(biāo)分別為C1、C2、C3、C4、C5、C6、C7、C8和C9,九個(gè)峰值的橫坐標(biāo)即為表格中垂直線的橫坐標(biāo)C1、C2、C3、C4、C5、C6、C7、C8和C9;
S24、對(duì)各個(gè)信息區(qū)域進(jìn)行二值化、色彩分離、圖像去除噪聲處理;
S25、采用Tesseract引擎對(duì)經(jīng)過(guò)步驟S24處理后的信息區(qū)域進(jìn)行字符識(shí)別,以獲取所需的發(fā)票信息;
步驟S22具體包括:
獲取增值稅普通發(fā)票彩色分離后帶表格的圖像,然后二值化的表格圖像;
對(duì)二值化的圖像進(jìn)行邊緣檢測(cè);
獲取檢測(cè)后的圖像然后進(jìn)行Hough變換;θ以一為增量,分別計(jì)算出每個(gè)點(diǎn)的ρ值大小,然后是M[θ][ ρ]加1;其中,參數(shù)空間(θ,ρ)表示表格圖像中的直線;θ的取值范圍為0-360,ρ的取值范圍為0-n,n的大小為增值稅普通發(fā)票對(duì)角線長(zhǎng)度;M[360][n]為定義的一個(gè)計(jì)數(shù)器;
取出二維數(shù)組M[θ][ρ]值最大的,此最大值對(duì)應(yīng)的θ為增值稅普通發(fā)票與水平方向上的傾斜角;
通過(guò)Hough變換獲得的傾斜角θ,根據(jù)角度θ對(duì)圖像傾斜較正。
2.根據(jù)權(quán)利要求1所述的基于插件的發(fā)票識(shí)別方法,其特征是,所述方法還包括:
將獲取到的發(fā)票信息存入到數(shù)據(jù)庫(kù)中。
3.根據(jù)權(quán)利要求1所述的基于插件的發(fā)票識(shí)別方法,其特征是,所述信息區(qū)域分為三類,第一類為發(fā)票代號(hào)、發(fā)票號(hào)碼,開票日期,第二類是金額相關(guān)信息,第三類為銷售方信息區(qū)域;
其中,針對(duì)第一類信息區(qū)域,先把彩色圖像轉(zhuǎn)換為灰度圖像,然后對(duì)灰度圖像進(jìn)行二值化,在圖像二值化后,采用連通域?yàn)V波對(duì)信息區(qū)域進(jìn)行去噪;
針對(duì)第二類信息區(qū)域,用先驗(yàn)閾值的方法去除圖片中紅色信息,用OTSU方法對(duì)圖像進(jìn)行二值化,之后進(jìn)行水平投影以確定金額上下邊界,然后進(jìn)行垂直投影以確定金額左右邊界,進(jìn)而提取金額信息,最后對(duì)圖像進(jìn)行圓滑;
針對(duì)第三類信息區(qū)域,先去除圖像中紅色的信息,然后進(jìn)行二值化,最后進(jìn)行投影切分。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中山大學(xué)新華學(xué)院,未經(jīng)中山大學(xué)新華學(xué)院許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710506334.X/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 發(fā)票閉環(huán)管理系統(tǒng)及方法
- 一種電子發(fā)票系統(tǒng)
- 改進(jìn)合同發(fā)票管理水平和效能的系統(tǒng)和方法
- 電子發(fā)票管理方法、移動(dòng)終端、管理平臺(tái)及存儲(chǔ)介質(zhì)
- 一種預(yù)防發(fā)票重復(fù)報(bào)銷的系統(tǒng)及方法
- 一種具備拆分報(bào)銷的發(fā)票管理平臺(tái)
- 一種發(fā)票識(shí)別的方法、裝置、存儲(chǔ)介質(zhì)及計(jì)算機(jī)設(shè)備
- 基于區(qū)塊鏈的發(fā)票管理方法及系統(tǒng)
- 發(fā)票管理方法及系統(tǒng)
- 發(fā)票匹配方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序





