[發明專利]一種票據識別方法及裝置有效
| 申請號: | 202010873968.0 | 申請日: | 2020-08-26 |
| 公開(公告)號: | CN111931687B | 公開(公告)日: | 2022-03-15 |
| 發明(設計)人: | 鄧練兵;宋宇軒;方文佳 | 申請(專利權)人: | 珠海大橫琴科技發展有限公司 |
| 主分類號: | G06V30/413 | 分類號: | G06V30/413 |
| 代理公司: | 北京三聚陽光知識產權代理有限公司 11250 | 代理人: | 胡曉靜 |
| 地址: | 519000 廣東省珠海市橫琴新*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 票據 識別 方法 裝置 | ||
本申請提供一種票據識別方法及裝置,該方法包括:獲取待處理圖像;其中,待處理圖像中包括票據圖像,票據圖像中包括多個票據元素;根據預設的票據元素樣本集合和待處理圖像對應的字符識別信息,確定票據圖像中的至少一個第一票據元素的識別結果;根據第一票據元素的識別結果中的位置特征,確定與第一票據元素存在位置關聯關系的至少一個第二票據元素對應的目標區域;根據目標區域對應的字符識別信息,確定第二票據元素的識別結果;根據第一票據元素的識別結果和至少一個第二票據元素的識別結果,生成票據識別結果。無需為不同票據類型的票據分別創建票據識別框架,具有較高的適應性。
技術領域
本發明涉及自動化辦公領域,具體涉及一種票據識別方法及裝置。
背景技術
隨著移動互聯網技術的發展,辦公智能化正在被廣泛應用,其中,票據涉及到社會生活的各個領域,對于票據的智能識別和處理已成為目前研究的重點。
在現有技術中,通常是利用光學字符識別(Optical Character Recognition,簡稱:OCR)技術,對待處理票據對應的票據圖像中的文字信息進行提取,并根據預設的票據識別框架,確定各文字信息對應的票據位置,對已獲得的文字信息進行分類。
但是,由于一些大型銀行經營范圍較廣,在辦理業務過程中,會產生種類繁多的票據。票據種類存在多樣化,現有技術中的票據識別方法的適應性較差,無法靈活應用于各種類型的票據。因此,急需一種能夠滿足多種應用場景的票據識別方法,對提高票據識別效率具有重要意義。
發明內容
因此,本發明要解決的技術問題在于現有技術中的票據識別方法存在適應性較差的缺陷,從而提供一種票據識別方法及裝置。
本申請第一個方面提供一種票據識別方法,包括:
獲取待處理圖像;其中,所述待處理圖像中包括票據圖像,所述票據圖像中包括多個票據元素;
根據預設的票據元素樣本集合和所述待處理圖像對應的字符識別信息,確定所述票據圖像中的至少一個第一票據元素的識別結果;其中,所述識別結果包括所述第一票據元素對應的元素類型、語義信息和位置特征;
根據所述第一票據元素的識別結果中的位置特征,確定與所述第一票據元素存在位置關聯關系的至少一個第二票據元素對應的目標區域;
根據所述目標區域對應的字符識別信息,確定所述第二票據元素的識別結果;
根據所述第一票據元素的識別結果和至少一個第二票據元素的識別結果,生成票據識別結果。
可選的,所述根據預設的票據元素樣本集合和所述待處理圖像對應的字符識別信息,確定所述票據圖像中的至少一個第一票據元素的識別結果,包括:
計算所述字符識別信息中的各字段與所述票據元素樣本集合中各樣本的相似度,根據所述相似度從大到小的排序結果,確定第一目標樣本和所述第一目標樣本對應的第一票據元素;
根據所述第一目標樣本對應的元素類型,確定所述第一票據元素的元素類型;
根據所述第一目標樣本對應的位置特征,確定所述第一票據元素的位置特征;
根據所述字符識別信息,確定所述第一票據元素的語義信息。
可選的,所述根據所述第一票據元素的識別結果中的位置特征,確定與所述第一票據元素存在位置關聯關系的至少一個第二票據元素對應的目標區域,包括:
在所述票據元素樣本集合中,確定至少一個與所述第一目標樣本存在位置關聯關系的第二目標樣本;根據所述第二目標樣本對應的位置特征,確定所述第二票據元素對應的目標區域。
可選的,所述根據所述目標區域對應的字符識別信息,確定所述第二票據元素的識別結果,包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于珠海大橫琴科技發展有限公司,未經珠海大橫琴科技發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010873968.0/2.html,轉載請聲明來源鉆瓜專利網。





