[發(fā)明專利]一種增值稅發(fā)票中發(fā)票代碼識別后處理方法有效
| 申請?zhí)枺?/td> | 202010436730.1 | 申請日: | 2020-05-21 |
| 公開(公告)號: | CN111768565B | 公開(公告)日: | 2022-03-18 |
| 發(fā)明(設(shè)計)人: | 程功勛;劉鵬鵬;謝偉;鄒馳;王瑛 | 申請(專利權(quán))人: | 程功勛;劉鵬鵬;謝偉;鄒馳;王瑛 |
| 主分類號: | G07F17/42 | 分類號: | G07F17/42;G06Q40/00 |
| 代理公司: | 北京金智普華知識產(chǎn)權(quán)代理有限公司 11401 | 代理人: | 巴曉艷 |
| 地址: | 330012 江西*** | 國省代碼: | 江西;36 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 增值稅發(fā)票 發(fā)票 代碼 識別 處理 方法 | ||
本發(fā)明提供一種增值稅發(fā)票中發(fā)票代碼識別后處理方法,屬于計算機視覺領(lǐng)域。該方法包括:采集增值稅發(fā)票圖像,并進行票面信息結(jié)構(gòu)化,獲取所有的結(jié)構(gòu)化信息;獲取第一字段發(fā)票代碼和第二字段發(fā)票代碼,通過比較二者是否相同對第一字段發(fā)票代碼和/或第二字段發(fā)票代碼進行校正;完成發(fā)票代碼識別后處理。通過本發(fā)明技術(shù)方案給出的方法,發(fā)票代碼的最終識別率從70%提高到98%,達到了很好的識別效果。
技術(shù)領(lǐng)域
本發(fā)明屬于計算機視覺領(lǐng)域,尤其是一種增值稅發(fā)票中發(fā)票代碼識別后處理方法。
背景技術(shù)
財務(wù)報銷是一個公司中所有必不可少的業(yè)務(wù),每一個公司的每一個人都有可能需要進行財務(wù)報銷,特別是業(yè)務(wù)銷售,財務(wù)報銷更是非常頻繁。
增值稅發(fā)票(增值稅專用發(fā)票、增值稅普通發(fā)票)是中國目前公司業(yè)務(wù)中使用的最多的兩種發(fā)票,之前發(fā)票的電子化一般是人工錄入,隨著OCR領(lǐng)域技術(shù)不斷普及,很多行業(yè)逐步采用了OCR識別技術(shù)代替人工錄入,很大程度提高了工作效率。隨著OCR識別技術(shù)的發(fā)展,目前有很多技術(shù)可以很好的識別紙質(zhì)發(fā)票上的所有內(nèi)容,并且結(jié)構(gòu)化出來。OCR識別發(fā)票技術(shù)被應(yīng)用于各行各業(yè),比如報銷、報稅、財務(wù)記賬、發(fā)票真?zhèn)尾轵灥鹊取?/p>
但是由于發(fā)票一般都是針式打印機套打,還會出現(xiàn)打印打偏、打出界、打不全、打重疊等等情況,如圖1,嚴重影像發(fā)票識別率。通過申請人統(tǒng)計,如果識別完成不做任何后處理,發(fā)票代碼的識別率只有70%左右。
發(fā)明內(nèi)容
為了解決以上問題,本發(fā)明提供了一種增值稅發(fā)票中發(fā)票代碼識別后處理方法,該方法針對打印打偏、打出界、打不全、打重疊等影響發(fā)票識別率的情況供一套行之有效的方法。經(jīng)分析,在增值稅發(fā)票上有2個發(fā)票代碼區(qū)域,一個是打印的發(fā)票代碼,一個是印刷的發(fā)票代碼,由于發(fā)票代碼可被用于鑒別發(fā)票的真?zhèn)危虼吮景l(fā)明技術(shù)方案將其作為依據(jù)通過發(fā)票代碼的校驗和后處理,可以提高發(fā)票代碼的識別率。通過本發(fā)明技術(shù)方案給出的方法,發(fā)票代碼的最終識別率從70%提高到98%,達到了很好的識別效果。
根據(jù)本發(fā)明的第一方面,提供一種增值稅發(fā)票中發(fā)票代碼識別后處理方法,所述增值稅發(fā)票包括新版增值稅普通發(fā)票、舊版增值稅普通發(fā)票和增值稅專用發(fā)票,其特征在于,所述方法包括:
步驟1:采集增值稅發(fā)票圖像,并進行票面信息結(jié)構(gòu)化,獲取所有的結(jié)構(gòu)化信息;
步驟2:獲取第一字段發(fā)票代碼和第二字段發(fā)票代碼,通過比較二者是否相同對第一字段發(fā)票代碼和/或第二字段發(fā)票代碼進行校正;
步驟3:完成發(fā)票代碼識別后處理。
進一步的,所述步驟1具體包括:
步驟11:采集一張或者多張增值稅發(fā)票圖像;
步驟12:通過結(jié)構(gòu)化模板對增值稅發(fā)票圖像進行票面信息結(jié)構(gòu)化處理;
步驟13:識別增值稅發(fā)票圖像的所有文字條目,得到所有的增值稅發(fā)票文字信息;
步驟14:對所有的增值稅發(fā)票文字信息進行結(jié)構(gòu)化分析,得到所有的結(jié)構(gòu)化信息。
進一步的,所述步驟12具體包括:
針對每種增值稅發(fā)票版式制定結(jié)構(gòu)化模板;
通過結(jié)構(gòu)化模板對特定版式的增值稅發(fā)票進行票面信息結(jié)構(gòu)化處理。
進一步的,所述步驟1還包括:將所有的結(jié)構(gòu)化信息轉(zhuǎn)換成用于傳輸和存儲的數(shù)據(jù)。
進一步的,所述輸出模式包括但不限于JSON格式和XML格式;所述數(shù)據(jù)格式按照企業(yè)自定義標準進行格式化輸出。
進一步的,所述步驟2具體包括:
步驟21:獲取第一字段發(fā)票代碼和第二字段發(fā)票代碼;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于程功勛;劉鵬鵬;謝偉;鄒馳;王瑛,未經(jīng)程功勛;劉鵬鵬;謝偉;鄒馳;王瑛許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010436730.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





