[發(fā)明專利]票據(jù)識別方法、裝置、電子設(shè)備及存儲介質(zhì)在審
| 申請?zhí)枺?/td> | 201910758270.1 | 申請日: | 2019-08-16 |
| 公開(公告)號: | CN110516664A | 公開(公告)日: | 2019-11-29 |
| 發(fā)明(設(shè)計)人: | 林彥伊 | 申請(專利權(quán))人: | 咪咕數(shù)字傳媒有限公司;咪咕文化科技有限公司;中國移動通信集團(tuán)有限公司 |
| 主分類號: | G06K9/20 | 分類號: | G06K9/20 |
| 代理公司: | 11002 北京路浩知識產(chǎn)權(quán)代理有限公司 | 代理人: | 王文思<國際申請>=<國際公布>=<進(jìn)入 |
| 地址: | 310012 浙江省杭州*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 目標(biāo)圖像 文本信息 定位點(diǎn) 票據(jù) 存儲介質(zhì) 電子設(shè)備 獲取目標(biāo) 快速識別 匹配成功 票據(jù)內(nèi)容 票據(jù)識別 信息獲取 比對 匹配 圖像 | ||
本發(fā)明實(shí)施例提供一種票據(jù)識別方法、裝置、電子設(shè)備及存儲介質(zhì)。所述方法包括:對目標(biāo)圖像進(jìn)行識別,確定所述目標(biāo)圖像中票據(jù)的文本信息,以及所述文本信息在目標(biāo)圖像中的位置信息;將所述文本信息及對應(yīng)的位置信息與模型進(jìn)行比對,得到與所述目標(biāo)圖像中的票據(jù)相匹配的模型;所述模型包括定位點(diǎn)信息,所述定位點(diǎn)信息包括用于定位的文本信息及對應(yīng)的位置信息;根據(jù)匹配成功的模型的定位點(diǎn)信息獲取所述目標(biāo)圖像包括的票據(jù)內(nèi)容。本發(fā)明實(shí)施例能夠快速識別并獲取目標(biāo)圖像所包括的票據(jù)的內(nèi)容。
技術(shù)領(lǐng)域
本發(fā)明涉及圖像識別技術(shù)領(lǐng)域,尤其涉及一種票據(jù)識別方法、裝置、電子設(shè)備及存儲介質(zhì)。
背景技術(shù)
隨著經(jīng)濟(jì)發(fā)展,許多公司都使用財務(wù)系統(tǒng)來處理公司的各類財務(wù)相關(guān)事項。其中,絕大多數(shù)財務(wù)事項均包括各類票據(jù)的識別。為了減輕財務(wù)人員的工作量,財務(wù)系統(tǒng)通常采用OCR(Optical Character Recognition,光學(xué)字符識別)技術(shù)對票據(jù)進(jìn)行識別,提取票據(jù)有效信息。
OCR技術(shù)對文字的識別不能一目十行,必須逐行切割,票據(jù)的格式、擺放位置及方向等均會影響OCR識別文字的準(zhǔn)確率,尤其多張票據(jù)并排粘貼在同一張報銷單的情況,現(xiàn)有技術(shù)首先通過特征匹配對報銷單的多張票據(jù)圖像進(jìn)行分割,然后對分割后的票據(jù)圖像分別進(jìn)行識別。由于票據(jù)種類過多,且存在票據(jù)格式不規(guī)范的問題,造成現(xiàn)有的多票據(jù)分割不準(zhǔn)確,最終使得后續(xù)OCR識別過程的準(zhǔn)確率低。
發(fā)明內(nèi)容
針對現(xiàn)有技術(shù)問題,本發(fā)明實(shí)施例提供一種票據(jù)識別方法、裝置、電子設(shè)備及存儲介質(zhì)。
本發(fā)明實(shí)施例提供一種票據(jù)識別方法,所述方法包括:
對目標(biāo)圖像進(jìn)行識別,確定所述目標(biāo)圖像中票據(jù)的文本信息,以及所述文本信息在目標(biāo)圖像中的位置信息;
將所述文本信息及對應(yīng)的位置信息與模型進(jìn)行比對,得到與所述目標(biāo)圖像中的票據(jù)相匹配的模型;
可選地,所述模型包括三個定位點(diǎn)信息和一個校正點(diǎn)信息,所述校正點(diǎn)信息包括用于校正的文本信息及對應(yīng)的位置信息;
所述將所述文本信息及對應(yīng)的位置信息與模型進(jìn)行比對,得到與所述目標(biāo)圖像中的票據(jù)相匹配的模型包括:
將所述目標(biāo)圖像的文本信息及對應(yīng)的位置信息與所述模型的三個定位點(diǎn)信息及一個校正點(diǎn)信息進(jìn)行匹配,確定與所述文本信息及對應(yīng)的位置信息相匹配的模型,以及所述模型所對應(yīng)的票據(jù)種類。
可選地,所述根據(jù)匹配成功的模型的定位點(diǎn)信息獲取所述目標(biāo)圖像包括的票據(jù)內(nèi)容包括:
根據(jù)匹配成功的模型的三個定位點(diǎn)信息和一個校正點(diǎn)信息,以及所述模型所屬于的票據(jù)種類,將所述目標(biāo)圖像中的票據(jù)內(nèi)容進(jìn)行定位并提取。
可選地,所述方法還包括建立目標(biāo)票據(jù)的模型子庫的步驟,具體包括:
對目標(biāo)票據(jù)的圖像進(jìn)行識別,確定所述目標(biāo)票據(jù)的文本信息,及所述文本信息在圖像中的位置信息;
將所述文本信息及對應(yīng)的位置信息與預(yù)設(shè)的票據(jù)基本信息數(shù)據(jù)庫進(jìn)行比對,提取出所述目標(biāo)票據(jù)的固定信息及對應(yīng)的位置信息,確定所述固定信息的文本類型及所述目標(biāo)票據(jù)的類型;其中,所述票據(jù)基本信息數(shù)據(jù)庫包括票據(jù)類型、每種票據(jù)的固定信息及每個固定信息的文本類型;
根據(jù)預(yù)定條件選取三個指定文本類型的固定信息及對應(yīng)的位置信息作為定位點(diǎn)信息,并選取一個除所述定位點(diǎn)以外的一個固定信息及對應(yīng)的位置信息作為校正點(diǎn)信息,建立所述目標(biāo)票據(jù)的模型子庫。
可選地,所述方法還包括:
計算所述票據(jù)基本信息數(shù)據(jù)庫中同一類票據(jù)中的每個固定信息的重復(fù)比例,所述重復(fù)比例為在所述同一類票據(jù)中當(dāng)前固定信息出現(xiàn)的次數(shù)占所述同一類票據(jù)中所有固定信息出現(xiàn)的次數(shù)的比例;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于咪咕數(shù)字傳媒有限公司;咪咕文化科技有限公司;中國移動通信集團(tuán)有限公司,未經(jīng)咪咕數(shù)字傳媒有限公司;咪咕文化科技有限公司;中國移動通信集團(tuán)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910758270.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:OCR識別準(zhǔn)確率的測試方法、裝置、計算機(jī)設(shè)備及存儲介質(zhì)
- 下一篇:識別圖像疊加文字區(qū)域的神經(jīng)網(wǎng)絡(luò)模型構(gòu)建方法與系統(tǒng)
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 一種文本信息顯示方法及終端
- 一種文本信息展示方法及裝置
- 一種非結(jié)構(gòu)化文本的關(guān)鍵信息挖掘方法、介質(zhì)及設(shè)備
- 一種目標(biāo)實(shí)體鏈接方法、裝置、設(shè)備及存儲介質(zhì)
- 信息標(biāo)注方法、裝置、計算機(jī)可讀存儲介質(zhì)及電子設(shè)備
- 一種文本信息識別的方法、人機(jī)對話的方法及相關(guān)裝置
- 文本匹配方法、文本匹配模型的訓(xùn)練方法及裝置、設(shè)備
- 文本信息修正方法、裝置、電子設(shè)備及存儲介質(zhì)
- 文本分類方法、裝置和電子設(shè)備
- 文本翻譯方法、裝置、設(shè)備及介質(zhì)
- 一種票據(jù)電子存根安全管理方法
- 票據(jù)驗(yàn)證方法和裝置
- 一種票據(jù)導(dǎo)向裝置及票據(jù)終端
- 一種智能票據(jù)管理系統(tǒng)
- 多票箱票據(jù)存儲裝置及其應(yīng)用的票據(jù)處理設(shè)備
- 一種多票箱票據(jù)存儲裝置及其應(yīng)用的票據(jù)處理設(shè)備
- 票據(jù)校驗(yàn)方法及裝置
- 一種票據(jù)檢驗(yàn)方法、裝置、終端設(shè)備及存儲介質(zhì)
- 票據(jù)數(shù)據(jù)處理方法、裝置、計算機(jī)設(shè)備和存儲介質(zhì)
- 票據(jù)管理系統(tǒng)、方法、計算機(jī)設(shè)備和存儲介質(zhì)





