[發(fā)明專利]手寫體漢字傾斜矯正方法及裝置有效
| 申請(qǐng)?zhí)枺?/td> | 201110163213.2 | 申請(qǐng)日: | 2011-06-17 |
| 公開(公告)號(hào): | CN102831418A | 公開(公告)日: | 2012-12-19 |
| 發(fā)明(設(shè)計(jì))人: | 鄒明福 | 申請(qǐng)(專利權(quán))人: | 漢王科技股份有限公司 |
| 主分類號(hào): | G06K9/32 | 分類號(hào): | G06K9/32 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100193 北京*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 手寫體 漢字 傾斜 矯正 方法 裝置 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及文字識(shí)別領(lǐng)域,特別涉及一種手寫體漢字傾斜矯正方法及裝置。
背景技術(shù)
在漢字識(shí)別系統(tǒng)中,從輸入端獲取的數(shù)據(jù)通常帶有很大的隨機(jī)噪聲,需要在正式識(shí)別之前對(duì)該數(shù)據(jù)進(jìn)行預(yù)處理。在這些隨機(jī)噪聲中,有一種就是漢字字符的書寫傾斜,這種傾斜的隨機(jī)性必然會(huì)對(duì)識(shí)別造成影響。因此,有必要在識(shí)別前的預(yù)處理過程中增加傾斜矯正的步驟,使得用端正書寫樣本訓(xùn)練所得的識(shí)別庫能夠識(shí)別各種情況下的斜體字或書寫不端正的漢字。
在現(xiàn)有的手寫體漢字傾斜矯正技術(shù)中,有一種方法是采用筆段方向信息進(jìn)行的聯(lián)機(jī)漢字的傾斜矯正,但是這種方法對(duì)橫豎筆畫較多的漢字有效果,對(duì)于橫豎筆畫部缺少的漢字卻是無能為力,存在明顯的誤矯和漏矯的問題。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題是針對(duì)現(xiàn)有技術(shù)中對(duì)多樣性的傾斜手寫體漢字存在誤矯和漏矯的缺陷,提出一種手寫體漢字傾斜矯正方法及裝置,為進(jìn)一步的手寫識(shí)別提供更為準(zhǔn)確的信息。
為了解決上述技術(shù)問題,本發(fā)明提供了一種手寫體漢字傾斜矯正方法,包括:
獲取步驟,獲取手寫體漢字的方向直方圖以及對(duì)手寫體漢字進(jìn)行傾斜矯正的定點(diǎn);
匹配步驟,將手寫體漢字的方向直方圖與樣本庫中多個(gè)方向直方圖模版進(jìn)行匹配,得到旋轉(zhuǎn)角度;
矯正步驟,根據(jù)確定的傾斜矯正的定點(diǎn)和旋轉(zhuǎn)角度,對(duì)手寫體漢字進(jìn)行傾斜矯正。
進(jìn)一步的,該方法還可以包括:樣本庫建立步驟,所述樣本庫建立步驟包括:
分別獲取每個(gè)漢字的多個(gè)樣本的方向直方圖,并對(duì)各方向直方圖取均值,得到該漢字的均值方向直方圖;將多個(gè)漢字的均值方向直方圖進(jìn)行聚類,得到多個(gè)作為聚類中心的方向直方圖模版,將所述各方向直方圖模版組成樣本庫。
進(jìn)一步的,所述獲取步驟包括:
按照一定的時(shí)間間隔,對(duì)手寫體漢字進(jìn)行采樣,得到連續(xù)的采樣點(diǎn);
將每?jī)蓚€(gè)連續(xù)的采樣點(diǎn)進(jìn)行連線,獲得該連線的角度,并獲得具有相同角度的連線個(gè)數(shù);
根據(jù)具有相同角度的連線個(gè)數(shù)和連線的角度經(jīng)量化形成的角度級(jí)別的對(duì)應(yīng)關(guān)系,得到手寫體漢字的方向直方圖;
以及,確定所述手寫體漢字的書寫起筆點(diǎn)為傾斜矯正的定點(diǎn)。
進(jìn)一步的,所述匹配步驟包括:
針對(duì)手寫體漢字的每一個(gè)角度級(jí)別,分別計(jì)算手寫體漢字的方向直方圖中該角度級(jí)別對(duì)應(yīng)的連線個(gè)數(shù)與樣本庫中每一個(gè)方向直方圖模版中該角度級(jí)別對(duì)應(yīng)的連線個(gè)數(shù)的差值;
比較得到差值的最小值,該差值的最小值對(duì)應(yīng)的角度級(jí)別即為旋轉(zhuǎn)角度的級(jí)別,從而得到旋轉(zhuǎn)角度。
進(jìn)一步的,所述矯正步驟具體為:以傾斜矯正的定點(diǎn)為旋轉(zhuǎn)起點(diǎn),按照旋轉(zhuǎn)角度對(duì)手寫體漢字進(jìn)行旋轉(zhuǎn)。
進(jìn)一步的,所述將多個(gè)漢字的均值方向直方圖進(jìn)行聚類,得到多個(gè)作為聚類中心的方向直方圖模版具體為:
采用基于均值距離的分級(jí)聚類方法將多個(gè)漢字的均值方向直方圖進(jìn)行聚類,得到多個(gè)作為聚類中心的方向直方圖模版,其中采用均值距離作為兩個(gè)類之間的相似性度量。
本發(fā)明提供了一種手寫體漢字傾斜矯正裝置,包括:
獲取模塊,用于獲取手寫體漢字的方向直方圖以及對(duì)手寫體漢字進(jìn)行傾斜矯正的定點(diǎn);
匹配模塊,用于將手寫體漢字的方向直方圖與樣本庫中多個(gè)方向直方圖模版進(jìn)行匹配,得到旋轉(zhuǎn)角度;
矯正模塊,用于根據(jù)確定的傾斜矯正的定點(diǎn)和旋轉(zhuǎn)角度,對(duì)手寫體漢字進(jìn)行傾斜矯正。
進(jìn)一步的,該裝置還可以包括:樣本庫建立模塊;所述樣本庫建立模塊包括:
直方圖獲取單元,用于分別獲取每個(gè)漢字的多個(gè)樣本的方向直方圖,并對(duì)各方向直方圖取均值,得到該漢字的均值方向直方圖;
聚類單元,用于將多個(gè)漢字的均值方向直方圖進(jìn)行聚類,得到多個(gè)作為聚類中心的方向直方圖模版,將所述各方向直方圖模版組成樣本庫。
進(jìn)一步的,所述獲取模塊包括:
采樣單元,用于按照一定的時(shí)間間隔,對(duì)手寫體漢字進(jìn)行采樣,得到連續(xù)的采樣點(diǎn);
連線單元,用于將每?jī)蓚€(gè)連續(xù)的采樣點(diǎn)進(jìn)行連線,獲得該連線的角度,并獲得具有相同角度的連線個(gè)數(shù);
獲取單元,用于根據(jù)具有相同角度的連線個(gè)數(shù)和連線的角度經(jīng)量化形成的角度級(jí)別的對(duì)應(yīng)關(guān)系,得到手寫體漢字的方向直方圖,以及
定點(diǎn)確定單元,用于確定所述手寫體漢字的書寫起筆點(diǎn)為傾斜矯正的定點(diǎn)。
進(jìn)一步的,所述匹配模塊包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于漢王科技股份有限公司,未經(jīng)漢王科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110163213.2/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 上一篇:自行車專用啤酒袋
- 下一篇:一種轉(zhuǎn)向支座
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





