[發明專利]一種基于骨架的抗噪聲漢字特征提取方法有效
| 申請號: | 201410360498.2 | 申請日: | 2014-07-25 |
| 公開(公告)號: | CN104156730B | 公開(公告)日: | 2017-12-01 |
| 發明(設計)人: | 周元峰;朱東方 | 申請(專利權)人: | 山東大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/46 |
| 代理公司: | 濟南圣達知識產權代理有限公司37221 | 代理人: | 張勇 |
| 地址: | 250061 山東*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 骨架 噪聲 漢字 特征 提取 方法 | ||
技術領域
本發明涉及圖像處理與模式識別技術領域,具體為一種魯棒的基于骨架的漢字特征自動提取的方法。
背景技術
漢字的識別是文字識別的一個領域。由于漢字字庫龐大,且漢字字形較多,無法像英文等字母型文字一樣具有較簡單的識別算法,因此對漢字的識別一直是比較困難的應用研究領域。漢字的識別一般分為印刷體漢字識別和手寫體漢字識別,對于印刷體的識別研究較多,但是手寫體由于具有差異性,因此識別率較低。
對于漢字的識別,特征提取是識別系統中最重要的環節之一。能夠提取不同形態、不同風格情況下的良好的特征是當前漢字識別中的研究重點之一。傳統的研究范圍里,方向特征被廣泛的用來提取漢字的特征,但是方向特征需要對漢字進行方向的規范化并建立彈性網格,而且對不同形態的手寫漢字識別較為困難,單純的基于方向特征的漢字特征提取無法滿足實際使用的需求。
另一種特征提取的方向是基于漢字骨架的方法。漢字的骨架能夠較強的表征出漢字的形狀拓撲結構,并且能夠較好的保持幾何性質,同時還能夠顯著的降低計算和匹配字庫的難度。雖然漢字骨架的提取可以用來表現漢字特征,但是由于漢字尤其是手寫漢字具有較強的差異性和低質性,因此對漢字的骨架進行較高質量的提取依然是當前的一個難題。較多的方法將關注點放在漢字輪廓的提取和處理上,另外一些方法使用形態學中的腐蝕法,不能較好的處理噪聲、稀疏、斷裂等低質量的漢字情形。
發明內容
為解決現有技術存在的不足,本發明公開了一種基于骨架的抗噪聲漢字特征提取方法,針對漢字尤其是低質漢字的差異性等特點,使用點云模型來覆蓋漢字,點云模型具有稀疏性、不連通性,并且能夠較好的降低噪聲對特征骨架提取的影響。通過轉化為點云模型進行骨架的提取,使用主成分分析法進行“分裂-合并”分類處理,最后使用最小平方距離方法擬合曲線。降低了噪聲等因素對漢字骨架提取的影響,并合理的對漢字筆畫進行分類和曲線擬合,最后得出較為光順的骨架特征。
為實現上述目的,本發明的具體方案如下:
一種基于骨架的抗噪聲漢字特征提取方法,包括以下步驟:
步驟一:將需要處理的文本的灰度圖像進行預處理,包括對灰度圖像進行平滑處理,并將灰度圖像進行二值化處理;
步驟二:對二值化處理后的灰度圖像進行下采樣,生成點云模型數據;
步驟三:對所述點云模型數據進行腐蝕操作得到粗中軸點集;
步驟四:基于該中軸點集依據分裂條件進行PCA分析分裂,得到分裂結果;
步驟五:對分裂結果進行合并,并對合并后交叉點處的點進行后處理;
步驟六:對步驟五處理后的點云數據進行B樣條曲線擬合,得到作為漢字特征的骨架。
所述步驟一中具體包括:
對掃描獲取到的文本的灰度圖像進行平滑處理,然后對平滑處理之后的圖像進行二值化操作轉化為只有黑色和白色的二值圖像,其中白色像素為背景顏色,黑色像素為前景漢字顏色,平滑處理的處理方法為使用OpenCV的cvSmooth方法對鄰域進行高斯平滑。
所述步驟二中具體包括:
對二值化處理后的圖像進行下采樣,采樣僅僅在黑色像素上進行,選取設定的采樣比例將圖像轉化為點云模型數據,每一個被采樣的像素點的橫向和豎向坐標組成點云數據的一個點坐標。
所述步驟三中具體包括:
使用腐蝕核對二值化處理后的灰度圖像的像素點云進行腐蝕集合操作,直到達到終止腐蝕的條件,得到最終的粗中軸點集;
所述終止腐蝕的條件為:二值化處理后的圖像中當前點周圍有八個鄰接點,判斷當前點的任意兩個鄰接黑色點互相之間是否連通,如果不連通,則表示是中軸點,否則不是中軸點。
所述步驟四中分裂條件為:
利用對局部相鄰的兩個圓內的點云子集點進行PCA分析得到的兩個局部主方向的夾角α來設置分裂條件。
所述步驟四中PCA分析分裂,具體包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東大學,未經山東大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410360498.2/2.html,轉載請聲明來源鉆瓜專利網。





