[發明專利]票據文本區域檢測方法及裝置在審
| 申請號: | 202010598358.4 | 申請日: | 2020-06-28 |
| 公開(公告)號: | CN111753842A | 公開(公告)日: | 2020-10-09 |
| 發明(設計)人: | 廖旺勝;莊恩瀚;李昀;李樂 | 申請(專利權)人: | 中國銀行股份有限公司 |
| 主分類號: | G06K9/34 | 分類號: | G06K9/34;G06K9/38;G06K9/40;G06K9/46;G06N3/04 |
| 代理公司: | 北京三友知識產權代理有限公司 11127 | 代理人: | 王天堯;吳學鋒 |
| 地址: | 100818 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 票據 文本 區域 檢測 方法 裝置 | ||
本發明公開了一種票據文本區域檢測方法及裝置,其中方法包括:獲得票據圖像;對所述票據圖像進行霍夫變換,確定票據圖像邊緣數據;根據所述票據圖像邊緣數據,對所述票據圖像進行矯正;對矯正后的票據圖像進行連通區域檢測;根據連通區域檢測的結果和預先建立的淺層神經網絡模型,進行票據文本區域檢測,所述淺層神經網絡模型根據連通區域檢測歷史結果預先建立。本發明有效提高檢測率和泛化能力,節省資源占用,提升客戶體驗。
技術領域
本發明涉及模式檢測技術領域,尤其涉及票據文本區域檢測方法及裝置。
背景技術
隨著智能移動設備的普及和創新型銀行的落地,銀行很多傳統柜面業務,例如票據錄入圈存,在線上進行。其中涉及對票據中的各種欄位進行文本區域檢測。
傳統OCR通常采用模式檢測的方式,當前OCR檢測通常采用深度學習的方法。現有模式檢測只需要一份標準樣本,但是海外票據樣式多而雜,更有客戶定制樣式,存在檢測率低以及泛化能力差的問題;而雖然深度學習的方法檢測率高以及通用性強,但需要海量樣本對模型進行訓練,票據屬于金融憑證,涉及客戶隱私,無法獲得海量的樣本數據,在樣本量不足的情況下會產生訓練不足的情況,且深度學習在移動端占用資源過大,導致客戶體驗不好。
發明內容
本發明實施例提供一種票據文本區域檢測方法,用以檢測票據文本區域,保證檢測率和泛化能力,節省資源占用,提升客戶體驗,該方法包括:
獲得票據圖像;
對所述票據圖像進行霍夫變換,確定票據圖像邊緣數據;
根據所述票據圖像邊緣數據,對所述票據圖像進行矯正;
對矯正后的票據圖像進行連通區域檢測;
根據連通區域檢測的結果和預先建立的淺層神經網絡模型,進行票據文本區域檢測,所述淺層神經網絡模型根據連通區域檢測歷史結果預先建立。
本發明實施例提供一種票據文本區域檢測裝置,用以檢測票據文本區域,保證檢測率和泛化能力,節省資源占用,提升客戶體驗,該裝置包括:
圖像獲得模塊,用于獲得票據圖像;
邊緣數據確定模塊,用于對所述票據圖像進行霍夫變換,確定票據圖像邊緣數據;
矯正模塊,用于根據所述票據圖像邊緣數據,對所述票據圖像進行矯正;
連通區域檢測模塊,用于對矯正后的票據圖像進行連通區域檢測;
文本區域檢測模塊,用于根據連通區域檢測的結果和預先建立的淺層神經網絡模型,進行票據文本區域檢測,所述淺層神經網絡模型根據連通區域檢測歷史結果預先建立。
本發明實施例還提供一種計算機設備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器執行所述計算機程序時實現上述票據文本區域檢測方法。
本發明實施例還提供一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有執行上述票據文本區域檢測方法的計算機程序。
相對于現有技術中通過模式檢測和深度學習檢測票據文本區域的方案而言,本發明實施例通過獲得票據圖像;對所述票據圖像進行霍夫變換,確定票據圖像邊緣數據;根據所述票據圖像邊緣數據,對所述票據圖像進行矯正;對矯正后的票據圖像進行連通區域檢測;根據連通區域檢測的結果和預先建立的淺層神經網絡模型,進行票據文本區域檢測,所述淺層神經網絡模型根據連通區域檢測歷史結果預先建立。本發明實施例在確定票據圖像邊緣數據后對票據圖像進行矯正,從而有效提高檢測率和泛化能力,對矯正后的票據圖像進行連通區域檢測,并結合淺層神經網絡模型進行票據文本區域檢測,無需海量樣本進行訓練,可以有效節省資源占用,提升客戶體驗。
附圖說明
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國銀行股份有限公司,未經中國銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010598358.4/2.html,轉載請聲明來源鉆瓜專利網。





