[發(fā)明專利]票據(jù)識(shí)別方法和裝置在審
| 申請(qǐng)?zhí)枺?/td> | 202011330551.6 | 申請(qǐng)日: | 2020-11-24 |
| 公開(kāi)(公告)號(hào): | CN112329708A | 公開(kāi)(公告)日: | 2021-02-05 |
| 發(fā)明(設(shè)計(jì))人: | 韓光耀;龐敏輝;陳禹燊;馮博豪 | 申請(qǐng)(專利權(quán))人: | 北京百度網(wǎng)訊科技有限公司 |
| 主分類號(hào): | G06K9/00 | 分類號(hào): | G06K9/00;G06K9/20;G06K9/62;G06N3/04;G06N3/08;G06N20/20 |
| 代理公司: | 北京英賽嘉華知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 11204 | 代理人: | 王達(dá)佐;馬曉亞 |
| 地址: | 100085 北京市*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 票據(jù) 識(shí)別 方法 裝置 | ||
本申請(qǐng)涉及圖像識(shí)別領(lǐng)域和自然語(yǔ)言處理領(lǐng)域,公開(kāi)了票據(jù)識(shí)別方法和裝置:通過(guò)獲取票據(jù)圖片,以及獲取票據(jù)圖片中關(guān)鍵字段的機(jī)器識(shí)別結(jié)果和機(jī)器識(shí)別結(jié)果關(guān)聯(lián)的特征數(shù)據(jù),并基于機(jī)器識(shí)別結(jié)果關(guān)聯(lián)的特征數(shù)據(jù)和關(guān)鍵字段對(duì)應(yīng)的二分類模型,得到關(guān)鍵字段的機(jī)器識(shí)別結(jié)果的置信度,二分類模型與關(guān)鍵字段一一對(duì)應(yīng),最后對(duì)關(guān)鍵字段的機(jī)器識(shí)別結(jié)果的置信度進(jìn)行判斷,以及響應(yīng)于確定關(guān)鍵字段的機(jī)器識(shí)別結(jié)果的置信度符合預(yù)設(shè)條件,將關(guān)鍵字段的機(jī)器識(shí)別結(jié)果確定為票據(jù)圖片中關(guān)鍵字段的識(shí)別結(jié)果。使得機(jī)器識(shí)別結(jié)果的置信度與機(jī)器識(shí)別結(jié)果的特征數(shù)據(jù)相關(guān),提高了機(jī)器識(shí)別結(jié)果的置信度的準(zhǔn)確性,從而根據(jù)該置信度確定票據(jù)識(shí)別結(jié)果,提高了票據(jù)識(shí)別結(jié)果的準(zhǔn)確性。
技術(shù)領(lǐng)域
本申請(qǐng)涉及計(jì)算機(jī)技術(shù)領(lǐng)域,具體涉及圖像識(shí)別領(lǐng)域和自然語(yǔ)言處理領(lǐng)域,尤其涉及一種票據(jù)識(shí)別方法和裝置。
背景技術(shù)
隨著科技不斷進(jìn)步,越來(lái)越多的票據(jù)需要審核,通過(guò)對(duì)票據(jù)進(jìn)行機(jī)器識(shí)別,得到票據(jù)中關(guān)鍵字段的識(shí)別結(jié)果,比如金額、日期、客戶姓名和用途等的機(jī)器識(shí)別結(jié)果,然后根據(jù)識(shí)別后的機(jī)器識(shí)別結(jié)果對(duì)票據(jù)進(jìn)行審核。然而很多票據(jù)由于拍攝的圖片比較模糊,不同的票據(jù)版式相差很大,圖片的拍攝角度差別也很大,對(duì)票據(jù)中關(guān)鍵字段的識(shí)別難度很大,從而導(dǎo)致關(guān)鍵字段的機(jī)器識(shí)別結(jié)果準(zhǔn)確率不高。因此,為了提高票據(jù)識(shí)別結(jié)果的準(zhǔn)確率,將關(guān)鍵字段的平均識(shí)別概率作為該關(guān)鍵字段的置信度,并通過(guò)提高關(guān)鍵字段的置信度閾值來(lái)提高關(guān)鍵字段的識(shí)別結(jié)果的準(zhǔn)確率。
然而隨著置信度閾值的不斷提高,關(guān)鍵字段的識(shí)別結(jié)果的準(zhǔn)確率會(huì)不斷增加,但是關(guān)鍵字段的識(shí)別結(jié)果的召回率會(huì)不斷下降,從而會(huì)損失很多識(shí)別正確的關(guān)鍵字段。
發(fā)明內(nèi)容
本申請(qǐng)實(shí)施例提供了一種票據(jù)識(shí)別方法、裝置、電子設(shè)備以及存儲(chǔ)介質(zhì)。
第一方面,本申請(qǐng)實(shí)施例提供了一種票據(jù)識(shí)別方法,該方法包括:獲取票據(jù)圖片,以及獲取票據(jù)圖片中關(guān)鍵字段的機(jī)器識(shí)別結(jié)果和機(jī)器識(shí)別結(jié)果關(guān)聯(lián)的特征數(shù)據(jù);基于機(jī)器識(shí)別結(jié)果關(guān)聯(lián)的特征數(shù)據(jù)和關(guān)鍵字段對(duì)應(yīng)的二分類模型,得到關(guān)鍵字段的機(jī)器識(shí)別結(jié)果的置信度,其中,二分類模型與關(guān)鍵字段一一對(duì)應(yīng);對(duì)關(guān)鍵字段的機(jī)器識(shí)別結(jié)果的置信度進(jìn)行判斷,以及響應(yīng)于確定關(guān)鍵字段的機(jī)器識(shí)別結(jié)果的置信度符合預(yù)設(shè)條件,將關(guān)鍵字段的機(jī)器識(shí)別結(jié)果確定為票據(jù)圖片中關(guān)鍵字段的識(shí)別結(jié)果。
在一些實(shí)施例中,二分類模型基于以下步驟實(shí)現(xiàn):獲取樣本票據(jù)圖片集,樣本票據(jù)圖片集包括訓(xùn)練圖片集;獲取訓(xùn)練圖片集中樣本關(guān)鍵字段的機(jī)器識(shí)別結(jié)果關(guān)聯(lián)的樣本特征數(shù)據(jù)和樣本關(guān)鍵字段的機(jī)器識(shí)別結(jié)果的標(biāo)注結(jié)果,其中,樣本關(guān)鍵字段的機(jī)器識(shí)別結(jié)果的標(biāo)注結(jié)果用于表征機(jī)器識(shí)別結(jié)果是否正確;基于樣本關(guān)鍵字段的樣本特征數(shù)據(jù)和對(duì)應(yīng)的標(biāo)注結(jié)果進(jìn)行訓(xùn)練,得到樣本關(guān)鍵字段對(duì)應(yīng)的二分類模型。
在一些實(shí)施例中,二分類模型還包括與關(guān)鍵字段對(duì)應(yīng)的模型標(biāo)識(shí);以及基于機(jī)器識(shí)別結(jié)果關(guān)聯(lián)的特征數(shù)據(jù)和關(guān)鍵字段對(duì)應(yīng)的二分類模型,得到關(guān)鍵字段的機(jī)器識(shí)別結(jié)果的置信度,包括:獲取與關(guān)鍵字段對(duì)應(yīng)的模型標(biāo)識(shí),并基于模型標(biāo)識(shí)調(diào)用與模型標(biāo)識(shí)對(duì)應(yīng)的二分類模型;將機(jī)器識(shí)別結(jié)果關(guān)聯(lián)的特征數(shù)據(jù)輸入二分類模型,得到關(guān)鍵字段的機(jī)器識(shí)別結(jié)果的置信度。
在一些實(shí)施例中,樣本票據(jù)圖片集還包括驗(yàn)證圖片集;該方法還包括:獲取驗(yàn)證圖片集中驗(yàn)證關(guān)鍵字段的機(jī)器識(shí)別結(jié)果的驗(yàn)證特征數(shù)據(jù)和驗(yàn)證關(guān)鍵字段的機(jī)器識(shí)別結(jié)果的標(biāo)注結(jié)果,其中,驗(yàn)證關(guān)鍵字段和樣本關(guān)鍵字段相同;響應(yīng)于獲取到樣本關(guān)鍵字段對(duì)應(yīng)的二分類模型,基于驗(yàn)證關(guān)鍵字段的機(jī)器識(shí)別結(jié)果的驗(yàn)證特征數(shù)據(jù)和標(biāo)注結(jié)果對(duì)二分類模型進(jìn)行參數(shù)調(diào)整,得到調(diào)整后的二分類模型。
在一些實(shí)施例中,樣本票據(jù)圖片集還包括測(cè)試圖片集;該方法還包括:獲取測(cè)試圖片集中的測(cè)試關(guān)鍵字段的機(jī)器識(shí)別結(jié)果的測(cè)試特征數(shù)據(jù)和測(cè)試關(guān)鍵字段的機(jī)器識(shí)別結(jié)果的標(biāo)注結(jié)果,其中,測(cè)試關(guān)鍵字段和樣本關(guān)鍵字段相同;響應(yīng)于獲取到調(diào)整后的二分類模型,基于測(cè)試關(guān)鍵字段的機(jī)器識(shí)別結(jié)果的測(cè)試特征數(shù)據(jù)和標(biāo)注結(jié)果對(duì)調(diào)整后的二分類模型進(jìn)行測(cè)試,得到調(diào)整后的二分類模型的準(zhǔn)確率和召回率。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京百度網(wǎng)訊科技有限公司,未經(jīng)北京百度網(wǎng)訊科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011330551.6/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書(shū)寫(xiě)字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫(huà)組成的,而且每個(gè)筆畫(huà)表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 一種票據(jù)電子存根安全管理方法
- 票據(jù)驗(yàn)證方法和裝置
- 一種票據(jù)導(dǎo)向裝置及票據(jù)終端
- 一種智能票據(jù)管理系統(tǒng)
- 多票箱票據(jù)存儲(chǔ)裝置及其應(yīng)用的票據(jù)處理設(shè)備
- 一種多票箱票據(jù)存儲(chǔ)裝置及其應(yīng)用的票據(jù)處理設(shè)備
- 票據(jù)校驗(yàn)方法及裝置
- 一種票據(jù)檢驗(yàn)方法、裝置、終端設(shè)備及存儲(chǔ)介質(zhì)
- 票據(jù)數(shù)據(jù)處理方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 票據(jù)管理系統(tǒng)、方法、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 識(shí)別媒體、識(shí)別媒體的識(shí)別方法、識(shí)別對(duì)象物品以及識(shí)別裝置
- 一種探針卡識(shí)別裝置和方法
- 識(shí)別裝置、識(shí)別方法以及記錄介質(zhì)
- 識(shí)別裝置、識(shí)別系統(tǒng),識(shí)別方法以及存儲(chǔ)介質(zhì)
- 識(shí)別程序、識(shí)別方法以及識(shí)別裝置
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 車載身份識(shí)別方法及系統(tǒng)
- 識(shí)別裝置、識(shí)別方法以及識(shí)別程序
- 識(shí)別裝置、識(shí)別方法及識(shí)別程序
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





