[發明專利]票據信息文本框獲取方法、系統、設備及存儲介質在審
| 申請號: | 202011471091.9 | 申請日: | 2020-12-14 |
| 公開(公告)號: | CN112613367A | 公開(公告)日: | 2021-04-06 |
| 發明(設計)人: | 王丹;屈舜中 | 申請(專利權)人: | 盈科票據服務(深圳)有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/20;G06K9/62 |
| 代理公司: | 深圳市恒程創新知識產權代理有限公司 44542 | 代理人: | 劉冰 |
| 地址: | 518000 廣東省深圳市南山區粵海街道高*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 票據 信息 文本框 獲取 方法 系統 設備 存儲 介質 | ||
本發明公開了票據信息文本框獲取方法、系統、設備及存儲介質,該方法包括:獲取待識別票據圖片,并識別待識別票據圖片中包含的所有文本框;提取所有文本框中每個文本框的文本框特征;根據每個文本框的文本框特征,采用預設檢測模型判斷每個文本框作為目標文本框的預測概率值;將預測概率值最大的文本框確定為對應類型的目標文本框。本發明解決了現有的票據識別方法中的提取規則過于復雜,難以維護,且容易出現規則沖突的問題,提高了票據識別中文本框的獲取精度,保證了票據信息提取的準確性。
技術領域
本發明涉及圖像識別技術領域,尤其涉及一種票據信息文本框獲取方法、系統、設備及存儲介質。
背景技術
票據識別過程中,主要依賴OCR技術對票據圖片上的文字進行識別,得到一個一個的文本塊,并從中提取關鍵信息,如票號、出票日期、到期日期、出票人全稱、收票人全稱、承兌人名稱、承兌人開戶行行號、出票金額等。各機構簽發的票據,需要包含的關鍵內容項是一致的,但格式會有所不同,這就給從圖片上提取票據的關鍵信息增加了難度。
現有的票據識別方法,一般是通過正則表達式技術、文本塊的相鄰關系、結合表格的單元格關系等,設定提取規則,遍歷圖片上的每個文本塊,對于符合規則的文本塊,認為是要提取的關鍵信息。這種方法需要配置復雜的規則,同時提取的準確性,依賴于表格識別的準確性。例如,如現有的公開號為CN110427853A,名稱為一種智能票據信息提取處理的方法的專利,該專利的技術方案是先對票據圖片進行預處理(裁剪取內容區域),再對票據進行分類,對不同的票據類型設定不同的提取規則進行關鍵信息提取,該專利的技術方案與上述方法類似,也是需要設定復雜的提取規則。可見,這種提取規則的設定,需要人工進行規則總結,工作量較大,且需要適配大量的樣本才能總結出一套完善的提取規則,最終會使得這套提取規則過于復雜,難以維護,且容易出現規則沖突的情況(如增加了一個新的規則,導致舊的規則失效等)。
發明內容
本申請實施例通過提供一種票據信息文本框獲取方法、系統、設備及存儲介質,旨在解決現有的票據識別方法中的提取規則過于復雜,難以維護,且容易出現規則沖突的問題。
本申請實施例提供了一種票據信息文本框獲取方法,所述票據信息文本框獲取方法,包括:
獲取待識別票據圖片,并識別所述待識別票據圖片中包含的所有文本框;
提取所有文本框中每個文本框的文本框特征;
根據每個所述文本框的文本框特征,采用預設檢測模型判斷每個所述文本框作為目標文本框的預測概率值;所述預設檢測模型包括多個不同類型的分類模型;
將預測概率值最大的文本框確定為對應類型的目標文本框。
在一實施例中,所述獲取待識別票據圖片,包括:
獲取原始票據圖片;
對所述原始票據圖片進行預處理,得到所述待識別票據圖片。
在一實施例中,所述識別所述待識別票據圖片中包含的所有文本框,包括:
獲取所述待識別票據圖片中每一文本信息所對應的矩形區域的四個頂點坐標,將四個所述頂點坐標按照預設順序進行連接,得到與每一所述文本信息對應的文本框。
在一實施例中,所述提取所有文本框中每個文本框的文本框特征,包括:
獲取所有文本框中每個文本框的第一文本框特征以及與每個所述文本框相鄰的文本框的第二文本框特征;
將所述第一文本框特征和所述與每個所述文本框相鄰的文本框的第二文本框特征共同作為所述文本框特征。
在一實施例中,所述根據每個所述文本框的文本框特征,采用預設檢測模型判斷每個所述文本框作為目標文本框的預測概率值之前,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于盈科票據服務(深圳)有限公司,未經盈科票據服務(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011471091.9/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:鉛酸電池負極板的制備方法和鉛酸電池
- 下一篇:一種爆破盲炮檢測方法
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





