[發明專利]基于多特征融合的實時手寫體數字識別方法有效
| 申請號: | 201410262086.5 | 申請日: | 2014-06-12 |
| 公開(公告)號: | CN103996057B | 公開(公告)日: | 2017-09-12 |
| 發明(設計)人: | 張鴻;馬彩云 | 申請(專利權)人: | 武漢科技大學 |
| 主分類號: | G06K9/80 | 分類號: | G06K9/80 |
| 代理公司: | 杭州宇信知識產權代理事務所(普通合伙)33231 | 代理人: | 張宇娟 |
| 地址: | 430081 *** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 特征 融合 實時 手寫體 數字 識別 方法 | ||
技術領域
本發明涉及手寫體數字識別技術領域,特別是涉及一種基于多特征融合的實時手寫體數字識別方法。
背景技術
手寫體數字識別是一個傳統和典型的模式識別問題,是光學字符識別(Optical Character Recognition)的一個重要組成部分,在實際生活中有著廣泛的應用。因為手寫體數字圖像缺少了筆畫的動態信息,并且書寫的風格各異,因此在識別過程中有很大的難度,誤識率也較高。但是,手寫體數字識別在一些特殊的場合有著不可替代的作用,比如郵政信件分揀中的郵政編碼識別,銀行支票中的手寫體數字識別等。由于手寫體數字識別經常涉及會計、金融領域,其嚴格性是不言而喻的,所以對識別系統的可靠性和識別率要求很高,構成了手寫體數字識別面臨的主要困難。因此,手寫體數字識別的研究有著重要的現實意義,也更具挑戰性。
手寫體數字的類別雖然僅僅只有10種,但是手寫體數字的識別是相當困難的。許多測試的結果顯示手寫體數字的識別率遠遠低于印刷體的漢字,甚至還沒有聯機的手寫體漢字的識別率高。造成這種情況的原因有:數字筆畫簡單,差別相對較小,再加上手寫體的書寫不規范,使得數字特征的提取存在很大的困難,進而識別起來就會有很大的誤識率和拒識率。
目前,雖然手寫體數字的識別已經研究了很長時間,并且取得了很大的突破和進展,但是手寫體數字的識別仍然存在兩個重要的問題。一是識別的精度還需要進一步的提高。二是大批量數據處理對系統速度又有相當高的要求,因此識別的速度也需要進一步的提高。現在社會已經跨入信息社會,數字識別的信息量會越來越大,因此,必須保證在高精度的前提下,努力去提高數字識別的速度。
而手寫體數字識別的精確率,與特征提取及融合密切相關。在過去的幾十年中,人們提出了很多方法來獲取手寫體數字的關鍵特征,主要分為兩大類:全局分析和結構分析。對前者,可使用模板匹配、像素密度、矩、特征點、數學變換等技術。這類的特征常常和統計分類方法一起使用。對于后者,多半需要從字符的輪廓或骨架上提取字符形狀的基本特征,包括:圈、端點、節點、弧、突起、凹陷、筆畫等等。這些結構特征往往與句法分類使用。
對于手寫體數字識別,難以實現高精度的有效識別。因此,對手寫體數字識別的研究正向著更為成熟、復雜、綜合的方向發展,尤其是在多特征的提取以及優化融合這些問題的研究上。
發明內容
本發明的目的在于提供一種基于多特征融合的實時手寫體數字識別方法,該方法能較好地分析結構特征與統計特征,既保留結構特征和統計特征中的鑒別信息,又在一定程度上消除冗余信息,使每個手寫體數字類別的特性更加明顯,更易于區分,進一步提高了手寫體數字的識別率。
為實現上述目的,本發明采用的技術方案包括以下步驟:
一種基于多特征融合的實時手寫體數字識別方法,包括如下步驟:
第一步、手寫體數字圖像的預處理
(1)對手寫體數字圖像I,轉化成256灰度級的位圖格式,并進行黑白二值化處理,得到二值圖像,用I1表示;
(2)截取二值圖像I1中的手寫體數字部分,使手寫體數字居于正中間,得到數字居中圖像I2;
(3)計算數字居中圖像I2的寬度W與長度H的比例W/H,以及白色像素點數量W_Num與總像素點數量S_Num的比例W_Num/S_Num,如果W/H低于閾值R1,則對圖像的寬度W做出調整,如果W_Num/S_Num低于閾值R2,則對圖像I2做膨脹運算,用I3表示調整形狀后的圖像;
(4)將調整形狀后的圖像I3縮放到N×N個像素點,并再次二值化,得到歸一化圖像,再對歸一化圖像做細化處理并消除小分支,得到預處理圖像I4;
第二步、手寫體數字圖像的結構特征和統計特征提取
(2)在結構特征上,提取過程如下:
分別計算預處理圖像I4在豎直方向的三個位置處的白色像素點的個數,得到3個特征值;
分別計算預處理圖像I4在水平方向的三個位置處的白色像素點的個數,得到3個特征值;
分別計算預處理圖像I4在左對角線和右對角線處的白色像素點的個數,得到2個特征值;
分別計算預處理圖像I4的端點數和四叉點數,得到2個特征值;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢科技大學,未經武漢科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410262086.5/2.html,轉載請聲明來源鉆瓜專利網。





