[發(fā)明專利]一種發(fā)票關(guān)鍵信息識(shí)別方法及系統(tǒng)在審
| 申請(qǐng)?zhí)枺?/td> | 201711190427.2 | 申請(qǐng)日: | 2017-11-24 |
| 公開(公告)號(hào): | CN109840520A | 公開(公告)日: | 2019-06-04 |
| 發(fā)明(設(shè)計(jì))人: | 湯斯鵬;陳曉冰;周實(shí)奇;張惠敏 | 申請(qǐng)(專利權(quán))人: | 中國移動(dòng)通信集團(tuán)廣東有限公司;中國移動(dòng)通信集團(tuán)公司 |
| 主分類號(hào): | G06K9/32 | 分類號(hào): | G06K9/32;G06K9/34;G06K9/00 |
| 代理公司: | 北京路浩知識(shí)產(chǎn)權(quán)代理有限公司 11002 | 代理人: | 王瑩;吳歡燕 |
| 地址: | 510623 廣東省廣州*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 邏輯行 發(fā)票 圖像 預(yù)設(shè)區(qū)域 關(guān)鍵信息識(shí)別 關(guān)鍵信息 算法處理 候選框 檢測框 歸并 算法 非極大值抑制 極值區(qū)域 標(biāo)注 自動(dòng)化 篩選 檢測 | ||
本發(fā)明實(shí)施例提供了一種發(fā)票關(guān)鍵信息識(shí)別方法及系統(tǒng),所述方法包括:S1,利用最大穩(wěn)定極值區(qū)域MSER算法對(duì)待識(shí)別發(fā)票的圖像中的文字進(jìn)行檢測,得到用于標(biāo)注所述圖像中的文字的多個(gè)候選框;S2,利用非極大值抑制NMS算法對(duì)所述多個(gè)候選框進(jìn)行篩選,得到與所述圖像中的文字一一對(duì)應(yīng)的多個(gè)檢測框;S3,對(duì)所述圖像中多個(gè)預(yù)設(shè)區(qū)域內(nèi)的檢測框進(jìn)行邏輯行歸并,在每個(gè)預(yù)設(shè)區(qū)域內(nèi)得到至少一個(gè)邏輯行;S4,從所述每個(gè)預(yù)設(shè)區(qū)域內(nèi)的各邏輯行中識(shí)別所述待識(shí)別發(fā)票的關(guān)鍵信息。通過對(duì)待識(shí)別發(fā)票圖像采用MSER算法處理、NMS算法處理和邏輯行歸并操作,實(shí)現(xiàn)了發(fā)票關(guān)鍵信息的高精度自動(dòng)化識(shí)別。
技術(shù)領(lǐng)域
本發(fā)明實(shí)施例涉及圖像處理技術(shù)領(lǐng)域,更具體地,涉及一種發(fā)票關(guān)鍵信息識(shí)別方法及系統(tǒng)。
背景技術(shù)
在財(cái)務(wù)管理系統(tǒng)中,發(fā)票常作為報(bào)銷憑證,對(duì)發(fā)票關(guān)鍵信息的識(shí)別關(guān)系到財(cái)務(wù)管理系統(tǒng)的準(zhǔn)確性,一個(gè)典型的財(cái)務(wù)報(bào)銷流程如下:首先每月結(jié)算出各個(gè)社會(huì)渠道網(wǎng)點(diǎn)的酬金金額,社會(huì)渠道網(wǎng)點(diǎn)根據(jù)酬金金額開發(fā)票。然后,發(fā)票提供給渠道經(jīng)理收集,收集后手工在Excel中錄入發(fā)票代碼、發(fā)票號(hào)碼、發(fā)票金額、開票渠道等信息,再發(fā)郵件給酬金管理員進(jìn)行匯總。然后,酬金管理員根據(jù)錄入的發(fā)票信息與渠道網(wǎng)點(diǎn)的酬金金額進(jìn)行比對(duì),如是多個(gè)月合并報(bào)賬的則要與多個(gè)月酬金金額核對(duì),如是多個(gè)子渠道合并報(bào)賬的則要多個(gè)子渠道匯總酬金金額核對(duì),如發(fā)票金額超過酬金金額則退回。最后,賬務(wù)管理員進(jìn)行稽核,稽核后再提交給財(cái)務(wù)部進(jìn)行報(bào)賬。
可見,上述報(bào)賬流程涉及到多項(xiàng)手工環(huán)節(jié),目前的技術(shù)解決方案主要是通過開發(fā)一個(gè)報(bào)賬輔助功能,提供發(fā)票的表單錄入、表單流轉(zhuǎn)流程、報(bào)賬流程審批等功能,這樣會(huì)存在以下問題:調(diào)用通用的文字識(shí)別接口對(duì)發(fā)票中的信息進(jìn)行識(shí)別時(shí),由于各種環(huán)境的光線明暗不同、發(fā)票擺放位置不一以及拍照相機(jī)分辨率不同等原因,導(dǎo)致對(duì)發(fā)票信息識(shí)別準(zhǔn)確率有很大的影響。
發(fā)明內(nèi)容
本發(fā)明實(shí)施例提供了一種克服上述問題或者至少部分地解決上述問題的發(fā)票關(guān)鍵信息識(shí)別方法及系統(tǒng)。
一方面本發(fā)明實(shí)施例提供了一種發(fā)票關(guān)鍵信息識(shí)別方法,所述方法包括:
S1,利用最大穩(wěn)定極值區(qū)域MSER算法對(duì)待識(shí)別發(fā)票的圖像中的文字進(jìn)行檢測,得到用于標(biāo)注所述圖像中的文字的多個(gè)候選框;
S2,利用非極大值抑制NMS算法對(duì)所述多個(gè)候選框進(jìn)行篩選,得到與所述圖像中的文字一一對(duì)應(yīng)的多個(gè)檢測框;
S3,對(duì)所述圖像中多個(gè)預(yù)設(shè)區(qū)域內(nèi)的檢測框進(jìn)行邏輯行歸并,在每個(gè)預(yù)設(shè)區(qū)域內(nèi)得到至少一個(gè)邏輯行;
S4,從所述每個(gè)預(yù)設(shè)區(qū)域內(nèi)的各邏輯行中識(shí)別所述待識(shí)別發(fā)票的關(guān)鍵信息。
進(jìn)一步地,在步驟S1之前還包括:
獲取所述待識(shí)別發(fā)票的原始圖像,并對(duì)所述原始圖像依次進(jìn)行輪廓檢測、矩形框計(jì)算和仿射變換得到所述待識(shí)別發(fā)票的圖像。
進(jìn)一步地,在步驟S3之前還包括:
根據(jù)待識(shí)別發(fā)票中關(guān)鍵信息的分布,對(duì)所述圖像進(jìn)行比例截取得到包含有關(guān)鍵信息的所述多個(gè)預(yù)設(shè)區(qū)域。
進(jìn)一步地,步驟S3具體包括:
在所述每個(gè)預(yù)設(shè)區(qū)域的圖像坐標(biāo)系中,將最大縱坐標(biāo)值處于多個(gè)第一預(yù)設(shè)范圍中任一第一預(yù)設(shè)范圍內(nèi)的檢測框歸入同一邏輯行,在所述每個(gè)預(yù)設(shè)區(qū)域內(nèi)得到至少一個(gè)邏輯行。
進(jìn)一步地,所述方法還包括:
若判斷獲知所述每個(gè)預(yù)設(shè)區(qū)域內(nèi)的各邏輯行中的同一邏輯行存在多個(gè)關(guān)鍵信息時(shí),則對(duì)所述同一邏輯行中的檢測框進(jìn)行邏輯列歸并。
進(jìn)一步地,所述對(duì)所述同一邏輯行中的檢測框進(jìn)行邏輯列歸并,具體包括:
在所述每個(gè)預(yù)設(shè)區(qū)域的圖像坐標(biāo)系中,將最大橫坐標(biāo)值處于多個(gè)第二預(yù)設(shè)范圍中任一第二預(yù)設(shè)范圍內(nèi)的檢測框歸入同一邏輯列,得到多個(gè)邏輯列。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國移動(dòng)通信集團(tuán)廣東有限公司;中國移動(dòng)通信集團(tuán)公司,未經(jīng)中國移動(dòng)通信集團(tuán)廣東有限公司;中國移動(dòng)通信集團(tuán)公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711190427.2/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 用于CMOS圖像傳感器的可變電壓行驅(qū)動(dòng)器
- 具有成簇的存儲(chǔ)器單元的非易失性存儲(chǔ)器器件
- 非易失性存儲(chǔ)器器件
- 用于側(cè)行鏈路邏輯信道的邏輯信道優(yōu)先級(jí)排序過程
- 用于非易失性存儲(chǔ)器器件的行解碼器以及相關(guān)方法
- 集成電路及用于相變非易失性存儲(chǔ)器器件的行解碼器電路
- 一種適用于顯示面板檢測的邏輯圖像解壓方法
- 一種載波選擇方法、用戶設(shè)備及計(jì)算機(jī)存儲(chǔ)介質(zhì)
- 邏輯信道優(yōu)先級(jí)排序的用戶設(shè)備、網(wǎng)絡(luò)節(jié)點(diǎn)和集成電路
- 半導(dǎo)體存儲(chǔ)裝置
- 發(fā)票閉環(huán)管理系統(tǒng)及方法
- 一種電子發(fā)票系統(tǒng)
- 改進(jìn)合同發(fā)票管理水平和效能的系統(tǒng)和方法
- 電子發(fā)票管理方法、移動(dòng)終端、管理平臺(tái)及存儲(chǔ)介質(zhì)
- 一種預(yù)防發(fā)票重復(fù)報(bào)銷的系統(tǒng)及方法
- 一種具備拆分報(bào)銷的發(fā)票管理平臺(tái)
- 一種發(fā)票識(shí)別的方法、裝置、存儲(chǔ)介質(zhì)及計(jì)算機(jī)設(shè)備
- 基于區(qū)塊鏈的發(fā)票管理方法及系統(tǒng)
- 發(fā)票管理方法及系統(tǒng)
- 發(fā)票匹配方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





