[發明專利]基于預處理的票據識別方法及裝置在審
| 申請號: | 202010146478.0 | 申請日: | 2020-03-05 |
| 公開(公告)號: | CN111325207A | 公開(公告)日: | 2020-06-23 |
| 發明(設計)人: | 丁平;楊春明;郭鑄;王欣;李起飛;宋科;張紅喜;張明威;夏理;趙虹;姚元偉;廖旺勝;王黨團;李娟;王冠華;吳文建;張天航;邊雅軍;王建標;農倩倩;彭勃;李福洋;李帥;奚堃博;黃子卿;朱江波;葉穎 | 申請(專利權)人: | 中國銀行股份有限公司 |
| 主分類號: | G06K9/32 | 分類號: | G06K9/32;G06K9/34;G06K9/40;G06K9/62 |
| 代理公司: | 北京三友知識產權代理有限公司 11127 | 代理人: | 薛平;谷敬麗 |
| 地址: | 100818 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 預處理 票據 識別 方法 裝置 | ||
1.一種基于預處理的票據識別方法,其特征在于,包括:
采集待識別票據的影像數據;
將所述待識別票據的影像數據,輸入至預先訓練好的票據分類模型中,輸出所述待識別票據的類別標識,其中,所述票據分類模型的輸入數據為待識別票據的影像數據,輸出數據為待識別票據的類別標識,所述類別標識包括:第一標識和第二標識,所述第一標識用于表征票據的OCR識別結果為識別成功,所述第二標識用于表征票據的OCR識別結果為識別失敗;
對第一標識的待識別票據進行OCR識別。
2.如權利要求1所述的方法,其特征在于,所述方法還包括:
獲取訓練數據和測試數據,其中,所述訓練數據包括:第一預設數量的第一票據和第二票據的影像數據,所述測試數據包括:第二預設數量的第一票據和第二票據的影像數據,所述第一票據為標注第一標識的票據,所述第二票據為標注第二標識的票據;
根據所述訓練數據和所述測試數據,通過機器學習訓練得到所述票據分類模型。
3.如權利要求2所述的方法,其特征在于,所述方法還包括:
采集多張票據的影像數據和OCR識別結果;
根據每張票據的OCR識別結果,對每張票據進行標注,其中,OCR識別成功的票據標注第一標識,OCR識別失敗的票據標注第二標識。
4.如權利要求1至3任一項所述的方法,其特征在于,所述票據分類模型為一個包含四個卷積層和三個全連接層的卷積神經網絡模型。
5.一種基于預處理的票據識別裝置,其特征在于,包括:
票據采集模塊,用于采集待識別票據的影像數據;
票據標注模塊,用于將所述待識別票據的影像數據,輸入至預先訓練好的票據分類模型中,輸出所述待識別票據的類別標識,其中,所述票據分類模型的輸入數據為待識別票據的影像數據,輸出數據為待識別票據的類別標識,所述類別標識包括:第一標識和第二標識,所述第一標識用于表征票據的OCR識別結果為識別成功,所述第二標識用于表征票據的OCR識別結果為識別失敗;
OCR識別模塊,用于對第一標識的待識別票據進行OCR識別。
6.如權利要求5所述的裝置,其特征在于,所述裝置還包括:
模型訓練模塊,用于獲取訓練數據和測試數據,根據所述訓練數據和所述測試數據,通過機器學習訓練得到所述票據分類模型,其中,所述訓練數據包括:第一預設數量的第一票據和第二票據的影像數據,所述測試數據包括:第二預設數量的第一票據和第二票據的影像數據,所述第一票據為標注第一標識的票據,所述第二票據為標注第二標識的票據。
7.如權利要求6所述的裝置,其特征在于,所述裝置還包括:
數據標注模塊,用于采集多張票據的影像數據和OCR識別結果,以及根據每張票據的OCR識別結果,對每張票據進行標注,其中,OCR識別成功的票據標注第一標識,OCR識別失敗的票據標注第二標識。
8.如權利要求5至7任一項所述的裝置,其特征在于,所述票據分類模型為一個包含四個卷積層和三個全連接層的卷積神經網絡模型。
9.一種計算機設備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,其特征在于,所述處理器執行所述計算機程序時實現權利要求1至4任一項所述基于預處理的票據識別方法。
10.一種計算機可讀存儲介質,其特征在于,所述計算機可讀存儲介質存儲有執行權利要求1至4任一項所述基于預處理的票據識別方法的計算機程序。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國銀行股份有限公司,未經中國銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010146478.0/1.html,轉載請聲明來源鉆瓜專利網。





