[發(fā)明專利]基于鑒別歸一化的手寫漢字識別方法有效
| 申請?zhí)枺?/td> | 201210225810.8 | 申請日: | 2012-07-03 |
| 公開(公告)號: | CN102831434A | 公開(公告)日: | 2012-12-19 |
| 發(fā)明(設(shè)計)人: | 朱遠平;何源;孫俊 | 申請(專利權(quán))人: | 天津師范大學;富士通株式會社 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/20 |
| 代理公司: | 天津市杰盈專利代理有限公司 12207 | 代理人: | 朱紅星 |
| 地址: | 300387 *** | 國省代碼: | 天津;12 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 鑒別 歸一化 手寫 漢字 識別 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明屬于模式識別學科技術(shù)領(lǐng)域,特別是涉及一種手寫漢字的識別方法。
背景技術(shù)
手寫漢字識別在辦公自動化、文檔數(shù)字化、人機交互等領(lǐng)域有著廣泛需求。但高精度的手寫漢字識別是文字識別領(lǐng)域中的一個困難的命題,制約著其實際應(yīng)用范圍。手寫漢字識別困難的根本原因在于手寫漢字樣本往往具有較顯著的變形情況,這導(dǎo)致相同漢字在形狀分布上不緊致。結(jié)合漢字的大類別情況,高精度地識別手寫漢字并不容易。為了彌補字符形變問題,字符圖像歸一化試圖將同一漢字的樣本向統(tǒng)一的形狀模式逼近,從而有效提高手寫漢字的識別效果,也是手寫漢字識別中不可或缺的環(huán)節(jié)。鑒別信息是區(qū)分不同字符樣本的重要信息,其來源于不同字符間的不相似性,對于識別過程很重要。傳統(tǒng)的字符圖像歸一化方法對所有的字符樣本采用同樣的規(guī)則處理,沒有考慮字符間的鑒別信息,不利于進一步提高手寫漢字的識別性能,尤其對于相似字之間的識別經(jīng)常出現(xiàn)錯誤。
發(fā)明內(nèi)容
本發(fā)明就是為了解決上述現(xiàn)有技術(shù)中的問題,而提供一種基于鑒別歸一化的手寫漢字識別方法,目的在于將鑒別信息結(jié)合到字符圖像歸一化中,從而使得在歸一化后的相似字在識別中更容易被區(qū)分開來,降低識別錯誤率。
本發(fā)明是按以下技術(shù)方案實現(xiàn)的:
一種基于鑒別歸一化的手寫漢字識別方法,包括訓練部分和識別部分兩大部分;其中,訓練部分包括如下步驟:
步驟1.1??創(chuàng)建相似字表:在漢字字符集中尋找相似字,并構(gòu)建相似字表;
步驟1.2??相似字顯著性區(qū)域檢測,即對相似字的不相似部分進行檢測;
步驟1.3??創(chuàng)建歸一化模型字典:將相似字表和各相似字對的顯著性區(qū)域的中心和尺寸參數(shù)等信息記錄在字典文件中;
步驟1.4??相似字分類器訓練:為上述相似字表中每一對相似字創(chuàng)建一個兩類分類器,專門用于區(qū)分對應(yīng)的兩個相似字;
識別部分包括如下步驟:
步驟2.1??初始識別:用普通的手寫漢字識別器對待識別字符樣本進行初始識別,獲得該字符樣本的漢字識別候選結(jié)果;
步驟2.2??相似字搜索:搜索相似字表,找到初始識別結(jié)果的前二候選構(gòu)成的字符對在相似字表中的匹配字對;
步驟2.3??字符圖像變換:利用相似字間的鑒別信息對上一步驟中的找到的相似字表中的匹配字對執(zhí)行鑒別歸一化,增加顯著性區(qū)域在字符圖像中所占尺寸比例;
步驟2.4??相似字識別:將在變換后的圖像上進行相似字識別,只對前二候選構(gòu)成的字符對中的兩個字符進行識別,所用的分類器為步驟1.4中生成的相似字兩類分類器。
其中,相似字顯著性區(qū)域檢測包括如下三個步驟:
步驟1.2.1??初始字符圖像歸一化:采用普通的字符圖像歸一化方法作為預(yù)處理,改善字符圖像形狀分布上的緊致性;
步驟1.2.2??字符特征抽取:將每一點的字符特征用坐標點的形式進行表示;
步驟1.2.3:顯著性區(qū)域分析:
顯著性區(qū)域建立在不相似區(qū)域上,利用字符特征差異圖發(fā)現(xiàn)不相似區(qū)域,用Tm(i,j,k),?Tn(i,j,k)分別表示字符Cm和Cn的特征模板,則字符特征差異圖表示為:
???????????????????????????(1)
令其方差為δ2;滿足下面條件的分格被視為不相似分格,即
??????????????????????????????????????????(2)
???????????????????????????????????(3)
合理的t值一般可取[-2.0,2.0]之間。
不相似分格組成不相似區(qū)域,顯著性區(qū)域(Saliency?Region--SR)被定義為覆蓋在不相似分格上的矩形區(qū)域,字符圖像中非顯著性區(qū)域部分即為相似區(qū)域。
根據(jù)不相似分格檢測結(jié)果,計算不相似區(qū)域的矩m00,m10,m01和中心矩μ20,μ02,則不相似區(qū)域的中心和軸長分別為:
??????????????????????????????????(4)
????????????????????????????????(5)
根據(jù)不相似區(qū)域中心位置,將顯著性區(qū)域分成9種類型,其中心為不相似區(qū)域中心,長寬分別為:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于天津師范大學;富士通株式會社,未經(jīng)天津師范大學;富士通株式會社許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210225810.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標記或含有代碼標記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





