[發(fā)明專利]一種基于骨架的抗噪聲漢字特征提取方法有效
| 申請?zhí)枺?/td> | 201410360498.2 | 申請日: | 2014-07-25 |
| 公開(公告)號: | CN104156730B | 公開(公告)日: | 2017-12-01 |
| 發(fā)明(設計)人: | 周元峰;朱東方 | 申請(專利權)人: | 山東大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/46 |
| 代理公司: | 濟南圣達知識產(chǎn)權代理有限公司37221 | 代理人: | 張勇 |
| 地址: | 250061 山東*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 骨架 噪聲 漢字 特征 提取 方法 | ||
1.一種基于骨架的抗噪聲漢字特征提取方法,包括以下步驟:
步驟一:將需要處理的文本的灰度圖像進行預處理,包括對灰度圖像進行平滑處理,并將灰度圖像進行二值化處理;
步驟二:對二值化處理后的灰度圖像進行下采樣,生成點云模型數(shù)據(jù);
步驟三:對所述點云模型數(shù)據(jù)進行腐蝕操作得到粗中軸點集;
步驟四:基于該中軸點云依據(jù)分裂條件進行PCA分析分裂,得到分裂結果;
步驟五:對分裂結果進行合并,并對合并后交叉點處的點進行后處理;
步驟六:對步驟五處理后的點云進行B樣條曲線擬合,得到作為漢字特征的骨架;
所述步驟一中具體包括:
對掃描獲取到的文本的灰度圖像進行平滑處理,然后對平滑處理之后的圖像進行二值化操作轉(zhuǎn)化為只有黑色和白色的二值圖像,其中白色像素為背景顏色,黑色像素為前景漢字顏色,平滑處理的處理方法為使用OpenCV的cvSmooth方法對鄰域進行高斯平滑;
所述步驟二中具體包括:
對二值化處理后的圖像進行下采樣,采樣僅僅在黑色像素上進行,選取設定的采樣比例將圖像轉(zhuǎn)化為點云模型數(shù)據(jù),每一個被采樣的像素點的橫向和豎向坐標組成點云數(shù)據(jù)的一個點坐標;
所述步驟三中具體包括:
使用腐蝕核對二值化處理后的灰度圖像的像素點云進行腐蝕集合操作,直到達到終止腐蝕的條件,得到最終的粗中軸點集;
腐蝕的集合定義如下所示:
S'=S-∑S·φi 公式1
上述公式中S'為一次腐蝕之后的像素集合,S為原始像素集,φi為腐蝕核在i位置的集合,“●”操作表示:如果當前位置腐蝕核與S交點個數(shù)為個數(shù)c,則返回該交點,否則返回0,pti表示在i點的二值圖像上的像素點;
所述步驟四中PCA分析分裂,具體包括:
從粗中軸點集中任意選取一個未處理的點,計算局部主方向,如果當前局部主方向Vi與下一點局部主方向Vj的處理結果為-1,則是轉(zhuǎn)折點,否則不是,繼續(xù)沿中軸點搜尋下一個PCA中心點進行處理,如果搜索不到中軸點,則當前點為轉(zhuǎn)折點,最后將任意一種類型i的第一個PCA中心點和最后一個PCA中心點標記為起點x(i)和終點y(i),并把這之間的點設為i類型,把這兩端點之間的PCA中心點Center(i)、半徑R(i)以及局部主方向Vi記錄下來作合并以及擬合之用,然后從粗中軸點集中再任意選一個點進行PCA分析分裂,直到所有的點都已經(jīng)被處理完畢,經(jīng)過有限次迭代,最終將粗中軸點集中所有點都處理完畢,得到最終的分裂集合;所述分裂條件為:利用對局部相鄰的兩個圓內(nèi)的點云進行PCA分析得到的兩個局部主方向的夾角α來設置分裂條件;
所述步驟五具體包括:
記PCA分析過程中的最大PCA半徑為MaxRadius,記某一分類i的端點x(i)和y(i),兩端點對應的PCA半徑為Rx(i)和Ry(i),dist(x(i),y(j))返回任意兩端點的距離,合并操作只發(fā)生在任意分類的端點處,通過判斷端點處是否符合其中的任一合并條件,當符合時,完成最后的合并操作;
所述合并條件包括:
條件一:對于分類i的兩個端點x(i)和y(i),如果dist(x(i),y(i))<=Rx(i)+Ry(i),且分類i的全部PCA中心點只有兩端點,即中心點個數(shù)為2,且有與兩特征圓相交的第二種分類j的端點x(j)或y(j),則分類i和分類j符合合并條件;
條件二:對于任意分類i和分類j,如果兩類中任意的兩端點,假設為分類i的x端點和j類的y端點,滿足x(i)與y(j)的連線形成的向量Vij與端點x的向量Vx夾角小于θ,θ為預先定義的轉(zhuǎn)折角度,且分類i和分類j端點處的任意兩點存在最大步長不大于RectSize/16的最小生成樹,RectSize為點云中距離最遠兩點的歐式距離;并且(V(x(i)),V(y(j))的夾角屬于[0,θ]或?qū)儆赱180–θ,180],則表示分類i和分類j符合合并條件,其中θ為前面定義的轉(zhuǎn)折角度;
條件三:于任意分類i和分類j,如果兩類中任意兩端點,假設為i類的x端點和j類的y端點,dist(x(i),y(j))<=Rx(i)+Ry(j),且兩個端點中y(j)不和自身x端點相交、x(i)不和自身y端點相交,同時兩端點也不和第三種分類的PCA單位特征圓相交,且分類i和分類j端點處的任意兩點存在最大步長不大于avgRectSize的最小生成樹,avgRectSize為點云中兩點間歐式距離的平均值,則分類i和分類j符合合并條件;
所述步驟六具體包括:
采用最小平方距離擬合方法,首先將PCA分析過程中產(chǎn)生的中心點集SCenter(i)作為初始的B樣條控制點,對控制點的數(shù)量以及位置進行調(diào)整,并用SDM方法迭代擬合B樣條曲線,最終得到的B樣條曲線作為漢字的骨架特征;
所述終止腐蝕的條件為:二值化處理后的圖像中當前點周圍有八個鄰接點,判斷當前點的任意兩個鄰接黑色點互相之間是否連通,如果不連通,則表示是中軸點,否則不是中軸點。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東大學,未經(jīng)山東大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410360498.2/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





