[發(fā)明專利]確定發(fā)票圖像中文本信息的方法、裝置、電子設(shè)備和介質(zhì)在審
| 申請(qǐng)?zhí)枺?/td> | 202210585658.8 | 申請(qǐng)日: | 2022-05-26 |
| 公開(kāi)(公告)號(hào): | CN114863452A | 公開(kāi)(公告)日: | 2022-08-05 |
| 發(fā)明(設(shè)計(jì))人: | 程林鵬;熊博穎;吳昀蓁;鄭邦東 | 申請(qǐng)(專利權(quán))人: | 中國(guó)建設(shè)銀行股份有限公司 |
| 主分類號(hào): | G06V30/412 | 分類號(hào): | G06V30/412;G06V10/22;G06V10/762;G06V10/764 |
| 代理公司: | 中科專利商標(biāo)代理有限責(zé)任公司 11021 | 代理人: | 陳文卓 |
| 地址: | 100033 *** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 確定 發(fā)票 圖像 文本 信息 方法 裝置 電子設(shè)備 介質(zhì) | ||
本公開(kāi)提供了一種確定發(fā)票圖像中文本信息的方法、裝置、設(shè)備、存儲(chǔ)介質(zhì)和程序產(chǎn)品,涉及計(jì)算機(jī)技術(shù)領(lǐng)域,可以應(yīng)用于金融技術(shù)領(lǐng)域。該方法包括:在確定待識(shí)別的發(fā)票圖像中存在目標(biāo)文本信息重疊的情況下,確定目標(biāo)區(qū)域,目標(biāo)區(qū)域包括存在目標(biāo)文本信息重疊的至少兩個(gè)目標(biāo)文本信息;至少兩個(gè)目標(biāo)文本信息包括針打目標(biāo)文本信息和印制目標(biāo)文本信息;對(duì)目標(biāo)區(qū)域的圖像進(jìn)行圖層分離,得到與針打目標(biāo)文本信息對(duì)應(yīng)的第一圖層和與印制目標(biāo)文本信息對(duì)應(yīng)的第二圖層;分別識(shí)別第一圖層和第二圖層,得到至少兩個(gè)識(shí)別結(jié)果;以及基于至少兩個(gè)識(shí)別結(jié)果確定發(fā)票圖像中的文本信息。
技術(shù)領(lǐng)域
本公開(kāi)涉及計(jì)算機(jī)技術(shù)領(lǐng)域,可以應(yīng)用于金融技術(shù)領(lǐng)域,更具體地涉及一種確定發(fā)票圖像中文本信息的方法、裝置、設(shè)備、介質(zhì)和程序產(chǎn)品。
背景技術(shù)
當(dāng)前,發(fā)票驗(yàn)真流程一般是通過(guò)發(fā)送發(fā)票驗(yàn)真要素至稅務(wù)系統(tǒng),如發(fā)票代碼、發(fā)票號(hào)碼、開(kāi)票日期等要素。由于通過(guò)稅務(wù)系統(tǒng)進(jìn)行發(fā)票驗(yàn)真需要較高的成本,因此,為了降低成本,一般在送往稅務(wù)系統(tǒng)前進(jìn)行初步篩查,過(guò)濾掉一部分假票或重復(fù)票。
初步篩查中的發(fā)票驗(yàn)真或查重均需要對(duì)發(fā)票圖像中與發(fā)票代碼、發(fā)票號(hào)碼、開(kāi)票日期等要素對(duì)應(yīng)的文本信息進(jìn)行核對(duì),因此需要確定發(fā)票圖像中的文本信息。然而,現(xiàn)有技術(shù)如文字識(shí)別技術(shù),得到的識(shí)別結(jié)果準(zhǔn)確性較低,這并不利于降低成本。
發(fā)明內(nèi)容
鑒于上述問(wèn)題,本公開(kāi)提供了確定發(fā)票圖像中文本信息的方法、裝置、設(shè)備、介質(zhì)和程序產(chǎn)品,通過(guò)上述確定發(fā)票圖像中文本信息的方法能夠提升發(fā)票圖像中文本信息的識(shí)別準(zhǔn)確率,有利于在后續(xù)驗(yàn)真或查詢過(guò)程中,準(zhǔn)確過(guò)濾掉假票或重復(fù)票,從而降低成本。
根據(jù)本公開(kāi)的第一個(gè)方面,提供了一種確定發(fā)票圖像中文本信息的方法,包括:在確定待識(shí)別的發(fā)票圖像中存在目標(biāo)文本信息重疊的情況下,確定目標(biāo)區(qū)域,所述目標(biāo)區(qū)域包括存在目標(biāo)文本信息重疊的至少兩個(gè)目標(biāo)文本信息;所述至少兩個(gè)目標(biāo)文本信息包括針打目標(biāo)文本信息和印制目標(biāo)文本信息;對(duì)所述目標(biāo)區(qū)域的圖像進(jìn)行圖層分離,得到與所述針打目標(biāo)文本信息對(duì)應(yīng)的第一圖層和與所述印制目標(biāo)文本信息對(duì)應(yīng)的第二圖層;分別識(shí)別所述第一圖層和第二圖層,得到至少兩個(gè)識(shí)別結(jié)果;以及基于所述至少兩個(gè)識(shí)別結(jié)果確定所述發(fā)票圖像中的文本信息。
根據(jù)本公開(kāi)實(shí)施例,所述對(duì)所述目標(biāo)區(qū)域的圖像進(jìn)行圖層分離,得到與所述針打目標(biāo)文本信息對(duì)應(yīng)的第一圖層和與所述印制目標(biāo)文本信息對(duì)應(yīng)的第二圖層,包括:采用灰色聚類法對(duì)所述目標(biāo)區(qū)域的圖像進(jìn)行圖層分離,得到與所述針打目標(biāo)文本信息對(duì)應(yīng)的第一圖層和與所述印制目標(biāo)文本信息對(duì)應(yīng)的第二圖層。
根據(jù)本公開(kāi)實(shí)施例,所述采用灰色聚類法對(duì)所述目標(biāo)區(qū)域的圖像進(jìn)行圖層分離,得到與所述針打目標(biāo)文本信息對(duì)應(yīng)的第一圖層和與所述印制目標(biāo)文本信息對(duì)應(yīng)的第二圖層,包括:基于核密度估計(jì)法確定目標(biāo)區(qū)域圖像中的極值點(diǎn);基于所述極值點(diǎn)進(jìn)行聚類,得到分類結(jié)果;以及基于所述分類結(jié)果進(jìn)行圖層分離,得到所述第一圖層和與所述第二圖層。
根據(jù)本公開(kāi)實(shí)施例,所述方法還包括:獲取所述待識(shí)別的發(fā)票圖像中的二維碼識(shí)別結(jié)果;以及基于所述二維碼識(shí)別結(jié)果,確定所述發(fā)票圖像中的文本信息是否正確。
根據(jù)本公開(kāi)實(shí)施例,所述方法還包括:根據(jù)所述發(fā)票圖像中的文本信息進(jìn)行查重處理。
本公開(kāi)的第二方面提供了一種確定發(fā)票圖像中文本信息的裝置,包括:第一確定模塊,用于在確定待識(shí)別的發(fā)票圖像中存在目標(biāo)文本信息重疊的情況下,確定目標(biāo)區(qū)域,所述目標(biāo)區(qū)域包括存在目標(biāo)文本信息重疊的至少兩個(gè)目標(biāo)文本信息;所述至少兩個(gè)目標(biāo)文本信息包括針打目標(biāo)文本信息和印制目標(biāo)文本信息;圖層分離處理模塊,用于對(duì)所述目標(biāo)區(qū)域的圖像進(jìn)行圖層分離,得到與所述針打目標(biāo)文本信息對(duì)應(yīng)的第一圖層和與所述印制目標(biāo)文本信息對(duì)應(yīng)的第二圖層;識(shí)別模塊,用于分別識(shí)別所述第一圖層和第二圖層,得到至少兩個(gè)識(shí)別結(jié)果;以及第二確定模塊,用于基于所述至少兩個(gè)識(shí)別結(jié)果確定所述發(fā)票圖像中的文本信息。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國(guó)建設(shè)銀行股份有限公司,未經(jīng)中國(guó)建設(shè)銀行股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210585658.8/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 發(fā)票閉環(huán)管理系統(tǒng)及方法
- 一種電子發(fā)票系統(tǒng)
- 改進(jìn)合同發(fā)票管理水平和效能的系統(tǒng)和方法
- 電子發(fā)票管理方法、移動(dòng)終端、管理平臺(tái)及存儲(chǔ)介質(zhì)
- 一種預(yù)防發(fā)票重復(fù)報(bào)銷的系統(tǒng)及方法
- 一種具備拆分報(bào)銷的發(fā)票管理平臺(tái)
- 一種發(fā)票識(shí)別的方法、裝置、存儲(chǔ)介質(zhì)及計(jì)算機(jī)設(shè)備
- 基于區(qū)塊鏈的發(fā)票管理方法及系統(tǒng)
- 發(fā)票管理方法及系統(tǒng)
- 發(fā)票匹配方法、裝置、電子設(shè)備和存儲(chǔ)介質(zhì)
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設(shè)備、圖像形成系統(tǒng)和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 文本匹配方法及裝置
- 互聯(lián)網(wǎng)金融非顯性廣告識(shí)別方法及裝置
- 文本結(jié)論智能推薦方法、裝置及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)
- 文本檢索方法、裝置及設(shè)備、文本檢索模型的訓(xùn)練方法
- 基于級(jí)連模式的文本匹配方法及裝置
- 一種文本關(guān)系提取方法、裝置及電子設(shè)備
- 文本的標(biāo)準(zhǔn)化處理方法、裝置、電子設(shè)備及計(jì)算機(jī)介質(zhì)
- 文本標(biāo)簽確定方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 文本圖像合成方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 文本生成方法、裝置和電子設(shè)備





