[發明專利]基于SVM的票據圖像分類方法有效
| 申請號: | 201610593126.3 | 申請日: | 2016-07-26 |
| 公開(公告)號: | CN106096667B | 公開(公告)日: | 2017-11-10 |
| 發明(設計)人: | 邵一婷;車少帥;于志文;胡笳;沈宇 | 申請(專利權)人: | 江蘇鴻信系統集成有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/46;G06K9/36 |
| 代理公司: | 南京鐘山專利代理有限公司32252 | 代理人: | 戴朝榮 |
| 地址: | 210005 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 svm 票據 圖像 分類 方法 | ||
技術領域
本發明屬于圖像處理領域,尤其涉及一種基于SVM的票據圖像分類方法。
背景技術
在票據的管理上,傳統票務管理依靠人工,人力成本較高,效率低,而且在票據比較多,任務比較緊的時候,傳統的方法需人力熬夜加班,甚至都無法完成指標,因此票據自動分類系統應運而生。
票據自動分類通過對票據掃描成的票據圖像的分析,采用圖像處理方法自動分類票據。目前的票據自動分類方法主要分為兩類,第一類是采用模板匹配方法,此方法通過將每一種類型的票據標準圖像制作成模板圖像,通過將待識別的圖像和每類模板進行模板匹配,將票據識別為匹配率最高的那一類;第二類是通過OCR的方法,識別票據中的特殊的數字和字母,對識別出的數字和字母進行類型識別,完成圖像的分類。但現有的票據分類方法存在一定的問題:首先第一類的方法和第二類的方法均從整幅圖像出發,復雜性高,時間成本高;第一類的方法和第二類的方法沒有傾斜校正的機制,若圖像中的目標物體位置傾斜,會影響圖像的匹配結果以及OCR字段識別,此時誤檢率較高;第一類采用模板匹配的方法需要將票據同每一類的模板進行匹配,耗時高,尤其是當票據種類較多時,此類方法呈現明顯的弱勢;第二類通過OCR的方法,識別圖像的特殊字段來分類票據,由于不同的票據有可能包含相同的標題字段,從而造成較高概率的錯誤分類;第一類的方法和第二類的方法中,沒有錯誤分類機制,它們將待識別的每一幅圖像都分成我們要處理的票據類別,而實際財務處理中,會出現很多不是我們需要的票據,將這些票據加入到財務系統不僅不會減輕財務人員的工作,反而無形中增加了勞動成本。
發明內容
本發明所要解決的技術問題是針對上述現有技術的不足提供一種基于SVM的票據圖像分類方法,基于SVM的票據圖像分類方法能準確的去除不屬于用戶需要的票據圖像,即提供了去除非待識別票據圖像的機制,使票據圖像的管理更加系統化,完善化;對票據圖像的公章區域進行處理,克服了從票據圖像整體進行處理的缺陷,提高了檢測的速度;對票據圖像進行傾斜校正,克服了由于票據圖像的傾斜而造成識別錯誤的情況;采用SVM分類方法,分類結果更加準確。
為實現上述技術目的,本發明采取的技術方案為:
基于SVM的票據圖像分類方法,包括以下步驟:
(1)選取多張標準票據圖像,作為樣本進行SVM分類器訓練,得到性能優化的SVM分類器;截取每一種類型的標準票據中的公章圖像并將所有的公章圖像組合成一幅公章模板;
(2)對待識別的原圖像進行二值化,通過Hough變換檢測直線的方法提取二值化后的圖像中的所有的直線,設定兩條直線之間的距離閾值,將圖像中直線之間的距離小于距離閾值的兩條直線合并成一條直線;設定直線數目的最大數目閾值和最小數目閾值,若圖像中所有直線的數目不在最大數目閾值和最小數目閾值之間,則將此待識別的原圖像分類為非識別票據圖像,否則執行步驟(3);
(3)對待識別的原圖像進行傾斜校正;
(4)根據公章的亮度特征設定公章的最大灰度閾值和最小灰度閾值,選取待識別的原圖像中灰度值在最大灰度閾值和最小灰度閾值之間的所有像素,判斷選取的每個像素的顏色并過濾不屬于公章部分顏色范圍的像素點從而得到輪廓集合,從輪廓集合中剔除面積較小的輪廓從而得到待識別的原圖像中公章的輪廓;
(5)將步驟(4)得到的公章輪廓與步驟(1)得到的公章模板進行匹配,若匹配不成功,則將待識別的原圖像分類為非識別票據圖像,若匹配成功,則執行步驟(6);
(6)提取公章輪廓的HOG特征,作為步驟(1)中性能優化的SVM分類器的輸入,得出待識別的原圖像的票據類型。
作為本發明進一步解決的技術方案,所述對待識別的原圖像進行傾斜校正,包括:
以待識別的原圖像的左上角為原點,待識別的原圖像的水平向右方向為X軸的正方向,待識別的原圖像的垂直向下方向為Y軸的正方向,建立坐標系;
通過Hough變換檢測直線的方法提取待識別的原圖像中的所有直線,將待識別的原圖像中的直線與X軸的正方向的夾角作為直線角度;
查找待識別的原圖像中兩條直線之間的夾角為90度的所有直線對,將所有直線對中角度最小的直線角度作為待識別的原圖像的旋轉角度,將待識別的原圖像進行逆時針旋轉,實現待識別的原圖像的傾斜較正;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江蘇鴻信系統集成有限公司,未經江蘇鴻信系統集成有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610593126.3/2.html,轉載請聲明來源鉆瓜專利網。
- 彩色圖像和單色圖像的圖像處理
- 圖像編碼/圖像解碼方法以及圖像編碼/圖像解碼裝置
- 圖像處理裝置、圖像形成裝置、圖像讀取裝置、圖像處理方法
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像解密方法、圖像加密方法、圖像解密裝置、圖像加密裝置、圖像解密程序以及圖像加密程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序以及圖像解碼程序
- 圖像編碼方法、圖像解碼方法、圖像編碼裝置、圖像解碼裝置、圖像編碼程序、以及圖像解碼程序
- 圖像形成設備、圖像形成系統和圖像形成方法
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序
- 圖像編碼裝置、圖像編碼方法、圖像編碼程序、圖像解碼裝置、圖像解碼方法及圖像解碼程序





