[發(fā)明專利]一種基于拆分匹配的漢字筆畫自動(dòng)提取方法在審
| 申請(qǐng)?zhí)枺?/td> | 201410404614.6 | 申請(qǐng)日: | 2014-08-15 |
| 公開(kāi)(公告)號(hào): | CN104182748A | 公開(kāi)(公告)日: | 2014-12-03 |
| 發(fā)明(設(shè)計(jì))人: | 董樂(lè);梁燕;封寧;徐宗懿;張寧 | 申請(qǐng)(專利權(quán))人: | 電子科技大學(xué) |
| 主分類號(hào): | G06K9/34 | 分類號(hào): | G06K9/34;G06K9/46 |
| 代理公司: | 成都華典專利事務(wù)所(普通合伙) 51223 | 代理人: | 徐豐 |
| 地址: | 610041 四川省*** | 國(guó)省代碼: | 四川;51 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 拆分 匹配 漢字 筆畫 自動(dòng) 提取 方法 | ||
1.一種基于拆分匹配的漢字筆畫自動(dòng)提取方法,包括如下步驟:
步驟一:根據(jù)漢字結(jié)構(gòu),將漢字拆分為多個(gè)筆畫部件;
步驟二:通過(guò)細(xì)化算法提取出步驟一得到的筆畫部件的骨骼圖,并通過(guò)計(jì)算每個(gè)字符像素的相交數(shù)找到骨骼圖中的交叉點(diǎn),再計(jì)算二值圖像中該交叉點(diǎn)二維鄰域中點(diǎn)PBOD曲線,將交叉點(diǎn)區(qū)域提取出來(lái),其它的則為筆畫段;
步驟三:對(duì)步驟一得到的筆畫部件提取特征,提取到的特征與標(biāo)準(zhǔn)庫(kù)中的筆畫部件的特征進(jìn)行匹配;
步驟四:根據(jù)步驟三的匹配結(jié)果對(duì)筆畫段進(jìn)行組合,獲得漢字的筆畫;如果筆畫部件匹配成功,則對(duì)步驟二所獲得的交叉點(diǎn)和筆畫段進(jìn)行優(yōu)化后,按照標(biāo)準(zhǔn)庫(kù)中相匹配的筆畫部件的筆畫段組合方式直接進(jìn)行組合并輸出;如果匹配失敗則根據(jù)筆畫段組合規(guī)則對(duì)其進(jìn)行筆畫提取,并通過(guò)交互,將正確提取筆畫的筆畫部件及其交叉點(diǎn)和組合方式添加到標(biāo)準(zhǔn)庫(kù)。
2.根據(jù)權(quán)利要求1所述的基于拆分匹配的漢字筆畫自動(dòng)提取方法,其特征在于,對(duì)步驟一進(jìn)行更詳細(xì)地描述為:根據(jù)漢字的二值圖像中筆畫是否連接或交叉把漢字拆分為數(shù)個(gè)筆畫部件C=[s1,s2,…,sk],其中C表示漢字,k表示該漢字拆分成的筆畫部件數(shù)目,si表示第i個(gè)筆畫部件;將漢字圖像規(guī)范化,判斷每個(gè)值為1的像素點(diǎn)鄰域是否都為1,如果不是則認(rèn)為該點(diǎn)是邊界點(diǎn);相互連通的邊界點(diǎn)標(biāo)注出一個(gè)筆畫部件。
3.根據(jù)權(quán)利要求1所述的基于拆分匹配的漢字筆畫自動(dòng)提取方法,其特征在于,對(duì)步驟二進(jìn)行更詳細(xì)地描述為:提取步驟一所獲得的筆畫部件的骨架圖;對(duì)每個(gè)筆畫部件所對(duì)應(yīng)的骨架圖計(jì)算每個(gè)像素的相交數(shù)Nc(p):
其中xi(i=1,…,9)是像素點(diǎn)p的鄰接點(diǎn),且x1=x9;若Nc(p)>2,則p為交叉點(diǎn);對(duì)于沒(méi)有交叉點(diǎn)的筆畫部件直接輸出筆畫,對(duì)于有交叉點(diǎn)的筆畫部件在找到骨架圖中的交叉點(diǎn)后以該點(diǎn)為中心,計(jì)算二值圖中p的二維鄰域中的點(diǎn)PBOD曲線,將交叉點(diǎn)區(qū)域提取出來(lái)。
4.根據(jù)權(quán)利要求1所述的基于拆分匹配的漢字筆畫自動(dòng)提取方法,其特征在于,對(duì)步驟二進(jìn)行更詳細(xì)地描述為:對(duì)步驟三進(jìn)行更詳細(xì)地描述:計(jì)算步驟一得到的筆畫部件的輪廓,把輪廓點(diǎn)作為筆畫部件的形狀特征,對(duì)輪廓點(diǎn)進(jìn)行采樣,計(jì)算每個(gè)采用輪廓點(diǎn)與其他采樣輪廓點(diǎn)的距離和方向并投影到極坐標(biāo)系,進(jìn)而計(jì)算出極坐標(biāo)系下的投影直方圖;
筆畫部件與標(biāo)準(zhǔn)字庫(kù)中的筆畫部件進(jìn)行匹配,每個(gè)筆畫部件被表示為對(duì)應(yīng)的投影直方圖,通過(guò)計(jì)算兩個(gè)投影直方圖間的距離,判斷兩個(gè)筆畫結(jié)構(gòu)是否匹配;采用歐式距離來(lái)度量投影直方圖間的距離,當(dāng)這個(gè)距離小于閥值時(shí),兩個(gè)筆畫結(jié)構(gòu)匹配成功。
5.根據(jù)權(quán)利要求1所述的基于拆分匹配的漢字筆畫自動(dòng)提取方法,其特征在于,對(duì)步驟二進(jìn)行更詳細(xì)地描述為:對(duì)步驟三進(jìn)行更詳細(xì)地描述:根據(jù)步驟三的匹配結(jié)果對(duì)筆畫段進(jìn)行組合,提取漢字的筆畫;如果筆畫部件si與標(biāo)準(zhǔn)庫(kù)中的某個(gè)筆畫部件sj匹配成功,則采用Kuhn-Munkras算法將筆畫部件的交叉點(diǎn)與匹配筆畫部件的交叉點(diǎn)進(jìn)行匹配,筆畫部件si有n交叉點(diǎn)表示為
如果筆畫部件si匹配失敗,標(biāo)準(zhǔn)庫(kù)中沒(méi)有和其匹配的筆畫部件,則將交叉區(qū)域和該交叉區(qū)域的任意兩個(gè)筆畫段進(jìn)行組合,計(jì)算交叉點(diǎn)的PBOD曲線,看PBOD曲線中是否只包含兩個(gè)波峰,且兩個(gè)波峰相距是否接近180度,如果是采用這種組合方式提取筆畫,輸出結(jié)果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于電子科技大學(xué);,未經(jīng)電子科技大學(xué);許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410404614.6/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





