[發明專利]電子裝置、票據識別方法及存儲介質在審
| 申請號: | 201811260786.5 | 申請日: | 2018-10-26 |
| 公開(公告)號: | CN109635633A | 公開(公告)日: | 2019-04-16 |
| 發明(設計)人: | 鄭佳 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06K9/00 | 分類號: | G06K9/00;G06K9/62 |
| 代理公司: | 深圳市沃德知識產權代理事務所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 票據 單框 特征向量 相似度 標準向量 存儲介質 電子裝置 票據表格 票據識別 圖片 工作效率 票據圖像 人力成本 數據分析 預先確定 直線檢測 預設 | ||
1.一種電子裝置,其特征在于,所述電子裝置包括存儲器、及與所述存儲器連接的處理器,所述處理器用于執行所述存儲器上存儲的票據識別程序,所述票據識別程序被所述處理器執行時實現如下步驟:
A1、對待識別的票據圖片中的表單進行直線檢測,獲取票據圖片中的各個表單框線和各個表單框線之間的位置關系;
A2、根據各個表單框線和各個表單框線之間的位置關系,計算出所述票據圖片的特征向量;
A3、計算所述表格的特征向量與預先確定的各類型票據表格的標準向量之間的相似度,若有某類型票據表格的標準向量與所述表格的特征向量之間的相似度小于或等于預設的相似度閾值,則確定待識別的票據圖片為該類型票據。
2.如權利要求1所述的電子裝置,其特征在于,所述步驟A2包括:
根據各個表單框線和各個表單框線之間的位置關系,提取表單框線的各個交叉點,獲取各個交叉點的信息,以及,獲取各個表單框線中水平方向表單框線的信息、和垂直方向表單框線的信息;
根據各個交叉點的信息、水平方向表單框線的信息和垂直方向表單框線的信息,識別出所述票據圖片中的表格;
對識別出的表格的所有交點進行位置標記,并根據預先確定的排序規則將所述位置標記進行排序,生成位置序列;
分別計算各個交點與所述位置序列中的預定義的位置點之間的像素距離,將計算得到的各個像素距離進行歸一化處理,得到所述表格的特征向量。
3.如權利要求1或2所述的電子裝置,其特征在于,所述票據識別程序被所述處理器執行時還實現如下步驟:
若確定出待識別的票據圖片對應的票據類型包含多個子類型,則根據預先訓練完成的分類器對該票據類型進行識別,以識別出待識別的票據圖片對應的子類型。
4.如權利要求3所述的電子裝置,其特征在于,所述預先訓練完成的分類器的訓練過程包括:
構造該票據類型的結構型Haar特征并與基本Haar特征組成新增特征庫,并利用該特征庫提取樣本特征值;
采用Adaboost算法訓練分類器,提取自適應分類閾值,得到最佳弱分類器;
多次迭代訓練多個弱分類器,加權平均成強分類器;
訓練多個強分類器,組成級聯分類器,所述級聯分類器為訓練完成的分類器。
5.如權利要求4所述的電子裝置,其特征在于,所述構造該票據類型的結構型Haar特征并與基本Haar特征組成新增特征庫,并利用該特征庫提取樣本特征值的步驟,包括:
設計該票據類型的三種結構型Haar矩形特征,包括該票據類型包含的行數和類型的Haar特征,其中,所述Haar每一行包含的列數與所述列數中包含有印刷字段的Haar特征,每一列包含的行數與所述行數中包含有印刷字段的Haar特征;
結合水平邊緣、垂直邊緣、水平中心、垂直中心和對角特征在內的五種基本的Haar特征組成新增Haar特征庫;
利用積分圖加速算法提取所有樣本特征值。
6.一種票據識別方法,其特征在于,所述方法包括如下步驟:
S1、對待識別的票據圖片中的表單進行直線檢測,獲取票據圖片中的各個表單框線和各個表單框線之間的位置關系;
S2、根據各個表單框線和各個表單框線之間的位置關系,計算出所述票據圖片的特征向量;
S3、計算所述表格的特征向量與預先確定的各類型票據表格的標準向量之間的相似度,若有某類型票據表格的標準向量與所述表格的特征向量之間的相似度小于或等于預設的相似度閾值,則確定待識別的票據圖片為該類型票據。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811260786.5/1.html,轉載請聲明來源鉆瓜專利網。





