[發(fā)明專利]基于多特征融合的實時手寫體數(shù)字識別方法有效
| 申請?zhí)枺?/td> | 201410262086.5 | 申請日: | 2014-06-12 |
| 公開(公告)號: | CN103996057B | 公開(公告)日: | 2017-09-12 |
| 發(fā)明(設(shè)計)人: | 張鴻;馬彩云 | 申請(專利權(quán))人: | 武漢科技大學(xué) |
| 主分類號: | G06K9/80 | 分類號: | G06K9/80 |
| 代理公司: | 杭州宇信知識產(chǎn)權(quán)代理事務(wù)所(普通合伙)33231 | 代理人: | 張宇娟 |
| 地址: | 430081 *** | 國省代碼: | 湖北;42 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 特征 融合 實時 手寫體 數(shù)字 識別 方法 | ||
1.一種基于多特征融合的實時手寫體數(shù)字識別方法,其特征在于包括如下步驟:
第一步、手寫體數(shù)字圖像的預(yù)處理
(1)對手寫體數(shù)字圖像I,轉(zhuǎn)化成256灰度級的位圖格式,并進(jìn)行黑白二值化處理,得到二值圖像,用I1表示;
(2)截取二值圖像I1中的手寫體數(shù)字部分,使手寫體數(shù)字居于正中間,得到數(shù)字居中圖像I2;
(3)計算數(shù)字居中圖像I2的寬度W與長度H的比例W/H,以及白色像素點數(shù)量W_Num與總像素點數(shù)量S_Num的比例W_Num/S_Num,如果W/H低于閾值R1,則對圖像的寬度W做出調(diào)整,如果W_Num/S_Num低于閾值R2,則對圖像I2做膨脹運(yùn)算,用I3表示調(diào)整形狀后的圖像;
(4)將調(diào)整形狀后的圖像I3縮放到N×N個像素點,并再次二值化,得到歸一化圖像,再對歸一化圖像做細(xì)化處理并消除小分支,得到預(yù)處理圖像I4;
第二步、手寫體數(shù)字圖像的結(jié)構(gòu)特征和統(tǒng)計特征提取
(1)在結(jié)構(gòu)特征上,提取過程如下:
分別計算預(yù)處理圖像I4在豎直方向的三個位置處的白色像素點的個數(shù),得到3個特征值;
分別計算預(yù)處理圖像I4在水平方向的三個位置處的白色像素點的個數(shù),得到3個特征值;
分別計算預(yù)處理圖像I4在左對角線和右對角線處的白色像素點的個數(shù),得到2個特征值;
分別計算預(yù)處理圖像I4的端點數(shù)和四叉點數(shù),得到2個特征值;
將上述特征值組合成維度為1×10的結(jié)構(gòu)特征向量T1;
(2)在統(tǒng)計特征上,提取過程如下:
將預(yù)處理圖像I4平均分成8區(qū)域,統(tǒng)計每個區(qū)域的白色像素點數(shù)量,得到8個特征值P1,P2,…,P8;
將預(yù)處理圖像I4平均分成4區(qū)域,統(tǒng)計每個區(qū)域的白色像素點數(shù)量,得到4個特征值P9,P10,P11,P12;
將預(yù)處理圖像I4縱向平均分成2區(qū)域,統(tǒng)計每個區(qū)域的白色像素點數(shù)量,得到2個特征值P13,P14;
將預(yù)處理圖像I4橫向平均分成2區(qū)域,統(tǒng)計每個區(qū)域的白色像素點數(shù)量,得到2個特征值P15,P16;
將預(yù)處理圖像I4橫向平均分成3區(qū)域,統(tǒng)計中間區(qū)域的白色像素點數(shù)量,得到1個特征值P17;
統(tǒng)計整個預(yù)處理圖像I4的白色像素點數(shù)量,得到1個特征值P18;
將特征值P1,P2,…,P18組成維度為1×18的統(tǒng)計特征向量T2;
第三步、手寫體數(shù)字圖像的結(jié)構(gòu)特征和統(tǒng)計特征融合
(1)根據(jù)第一步,對手寫體數(shù)字圖像數(shù)據(jù)庫中所有的K幅圖像做預(yù)處理再根據(jù)第二步,對每幅預(yù)處理后的圖像提取結(jié)構(gòu)特征和統(tǒng)計特征,得到維度為K×10的結(jié)構(gòu)特征向量集S和維度為K×18的統(tǒng)計特征向量集T;
(2)對結(jié)構(gòu)特征向量集S做歸一化處理;
(3)對統(tǒng)計特征向量集T做歸一化處理;
(4)將歸一化后的結(jié)構(gòu)特征向量集S和統(tǒng)計特征向量集T,按行拼接并轉(zhuǎn)置后得到維度為28×K的融合特征向量集S_T;
所述結(jié)構(gòu)特征向量集S和統(tǒng)計特征向量集T的每個特征值的歸一化由以下公式處理得到:
a、求出結(jié)構(gòu)特征向量集S的最大值max_S與最小值min_S,對結(jié)構(gòu)特征向量集S中的數(shù)據(jù)做歸一化處理,歸一化函數(shù)如下:
Sij=(Sij-min_S)/(1+max_S-min_S) (2)
式(2)中Sij表示結(jié)構(gòu)特征向量集S中的第i行第j個數(shù)據(jù),
i的取值范圍是[1,K]的整數(shù),
j的取值范圍是[1,10]的整數(shù);
b、求出統(tǒng)計特征向量集T的最大值max_T最小值min_T,對統(tǒng)計特征向量集T中的數(shù)據(jù)做歸一化處理,歸一化函數(shù)如下:
Tij=(Tij-min_T)/(1+max_T-min_T) (3)
式(3)中Tij表示統(tǒng)計特征向量集T中的第i行第j個數(shù)據(jù),
i的取值范圍是[1,K]的整數(shù),
j的取值范圍是[1,18]的整數(shù);
第四步、基于反向傳播神經(jīng)網(wǎng)絡(luò)的識別模型
(1)設(shè)置反向傳播神經(jīng)網(wǎng)絡(luò)的參數(shù),包括學(xué)習(xí)速率,動量因子,最大訓(xùn)練次數(shù),以及性能目標(biāo)值;
(2)用維度為4的向量表示手寫體數(shù)字類別,設(shè)置融合特征向量集S_T的每個特征向量對應(yīng)的手寫體數(shù)字類別向量,隨機(jī)選擇融合特征向量集S_T的一部分作為訓(xùn)練樣本集,余下的部分作為測試樣本集,對反向傳播神經(jīng)網(wǎng)絡(luò)進(jìn)行多次訓(xùn)練和測試,并保存檢驗結(jié)果最好的反向傳播神經(jīng)網(wǎng)絡(luò);
第五步、新手寫體數(shù)字圖像的識別
將用戶輸入的待識別的手寫體數(shù)字圖像,按照第一步至第三步的方法進(jìn)行處理,得到維度為28×1的融合特征向量,將其輸入到第四步中的反向傳播神經(jīng)網(wǎng)絡(luò)進(jìn)行識別,得到4×1的輸出向量,將該輸出向量轉(zhuǎn)置并四舍五入,得到維度為4的向量即為該待識別的手寫體數(shù)字的識別結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于武漢科技大學(xué),未經(jīng)武漢科技大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410262086.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





