[發明專利]一種票據分類識別方法及系統在審
| 申請號: | 201910577143.1 | 申請日: | 2019-06-28 |
| 公開(公告)號: | CN110348346A | 公開(公告)日: | 2019-10-18 |
| 發明(設計)人: | 郭近之;王宇;趙娟;陸俊龍;徐偉豪 | 申請(專利權)人: | 蘇寧云計算有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06Q40/00 |
| 代理公司: | 江蘇圣典律師事務所 32237 | 代理人: | 許峰 |
| 地址: | 210042 江蘇省南*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 票據 文字識別 圖片 票據分類 票據識別 封裝 分類效率 文字內容 業務使用 自動分類 分類 分揀 財務 分割 審核 | ||
1.一種票據分類識別方法,其特征在于,包括:
S10獲取含有票據的圖片,對所述圖片中的票據進行識別分類,獲得票據識別結果,所述圖片包括N張票據,N為大于1的整數,所述票據識別結果包括N張單張票據圖片;
S20對所述N張單張票據圖片進行文字識別,獲得文字識別結果;
S30將所述文字識別結果封裝成專項模型。
2.根據權利要求1所述的方法,其特征在于,所述步驟S10中使用OCR識別技術對所述圖片中的票據進行識別分類,具體包括:
S101將所述圖片的大小調整設定值;
S102在所述調整后的圖片上運行單個卷積網絡;
S103由OCR識別技術中的目標檢測模型的置信度對S102獲得的圖片運行卷積結果進行閾值處理;
S104利用神經網絡做圖像語義分割,獲得N張單張票據圖片。
3.根據權利要求1所述的方法,其特征在于,所述步驟S20中使用OCR識別技術對N張單張票據圖片進行文字識別,獲得文字識別結果,所述文字識別結果包括所述單張票據圖片上的文字以及所述文字位于所述單張票據圖片上的坐標。
4.根據權利要求1所述的方法,其特征在于,所述步驟S30具體包括:
S301根據所述文字識別結果,得到所述單張票據圖片上的票據所屬的類型;
S302根據所述票據所屬的類型,將文字識別結果封裝成所述票據的專項模型,所述專項模型包括至少一個業務字段;
S303將所述一個或多個業務字段約定為所述專項模型的目標字段。
5.一種票據分類識別系統,其特征在于,包括:
票據識別模塊,用于獲取含有票據的圖片,對所述圖片中的票據進行識別分類,獲得票據識別結果,所述圖片包括N張票據,N為大于1的整數,所述票據識別結果包括N張單張票據圖片;
文字識別模塊,用于對所述N張單張票據圖片進行文字識別,獲得文字識別結果;
封裝模塊,用于將所述文字識別結果封裝成專項模型。
6.根據權利要求5所述的系統,其特征在于,所述票據識別模塊進一步用于使用OCR識別技術對所述圖片中的票據進行識別分類,具體包括:
調整模塊,用于將所述圖片的大小調整設定值;
卷積模塊,用于在所述調整后的圖片上運行單個卷積網絡;
處理模塊,用于由OCR識別技術中的目標檢測模型的置信度對S102獲得的圖片運行卷積結果進行閾值處理;
分割模塊,用于利用神經網絡做圖像語義分割,獲得N張單張票據圖片。
7.根據權利要求5所述的系統,其特征在于,所述文字識別模塊進一步用于使用OCR識別技術對N張單張票據圖片進行文字識別,獲得文字識別結果,所述文字識別結果包括所述單張票據圖片上的文字以及所述文字位于所述單張票據圖片上的坐標。
8.根據權利要求5所述的系統,其特征在于,所述封裝模塊包括:
匹配模塊,用于根據所屬文字識別結果,得到所述單張票據圖片上的票據所屬的類型;
轉換模塊,用于根據所述票據所屬的類型,將文字識別結果封裝成所述票據的專項模型,所述專項模型包括至少一個業務字段;
約定模塊,用于將所述一個或多個業務字段約定為所述專項模型的目標字段。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇寧云計算有限公司,未經蘇寧云計算有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910577143.1/1.html,轉載請聲明來源鉆瓜專利網。





