[發(fā)明專利]一種用于聯(lián)機(jī)手寫漢字識(shí)別的漢字筆畫特征提取方法無效
| 申請?zhí)枺?/td> | 200910041047.1 | 申請日: | 2009-07-10 |
| 公開(公告)號(hào): | CN101604393A | 公開(公告)日: | 2009-12-16 |
| 發(fā)明(設(shè)計(jì))人: | 金連文;鄧國強(qiáng) | 申請(專利權(quán))人: | 華南理工大學(xué) |
| 主分類號(hào): | G06K9/46 | 分類號(hào): | G06K9/46 |
| 代理公司: | 廣州粵高專利商標(biāo)代理有限公司 | 代理人: | 何淑珍 |
| 地址: | 510640廣東*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 用于 聯(lián)機(jī) 手寫 漢字 識(shí)別 筆畫 特征 提取 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明屬于聯(lián)機(jī)手寫漢字識(shí)別技術(shù)領(lǐng)域,特別是涉及一種用于聯(lián)機(jī)手寫漢字識(shí)別的筆畫特征提取方法。
技術(shù)背景
聯(lián)機(jī)手寫漢字識(shí)別是指用戶一邊書寫一邊識(shí)別。一般是指用戶通過手寫輸入設(shè)備(比如:手寫板、觸摸屏、鼠標(biāo)等)書寫漢字,同時(shí)計(jì)算機(jī)將手寫輸入設(shè)備采集到的漢字書寫軌跡轉(zhuǎn)換為相應(yīng)的漢字機(jī)器內(nèi)碼的識(shí)別技術(shù)。按書寫限制的程度,一般可以分為:限制性手寫體(如限制筆順,橫平豎直,沒有連筆),手寫印刷體(指書寫工整的漢字),行書手寫體(指有部分筆畫變形和連筆的漢字),草書手寫體(指大部分筆畫變形以及幾乎完全連筆書寫的漢字)。這幾種手寫體的識(shí)別難度依次增大,以草書手寫體的識(shí)別難度最大。因?yàn)椴輹謱戵w的漢字字型通常已經(jīng)和原漢字字形有了較大的不同,不僅表現(xiàn)在筆畫的變形上,還表現(xiàn)在漢字結(jié)構(gòu)的變形上。這些變形一般是由于書寫者為了達(dá)到更快、更流暢的書寫速度而在原有漢字字形的基礎(chǔ)上改變而來的。因此在以上幾種手寫體漢字中,以草書手寫體的書寫速度最快,因而這種書寫方式也是人們最樂于接受的一種書寫方式。
已有的漢字識(shí)別方法大多數(shù)是基于漢字筆畫來進(jìn)行識(shí)別的,比如中國發(fā)明專利98106953.3號(hào)專利《手寫漢字識(shí)別方法及裝置》、98108373.0號(hào)專利《文字識(shí)別裝置及文字識(shí)別方法》以及98122949.2號(hào)專利《一種無筆畫順序的手寫字符辨識(shí)系統(tǒng)》等專利使用的方法都依賴于筆畫的正確提取與識(shí)別,而草書手寫體漢字不但連筆書寫,大部分筆畫變形嚴(yán)重,而且有很多短的筆畫會(huì)被省去,因此以上識(shí)別方法無法很好地解決草書手寫體漢字的識(shí)別。
目前,識(shí)別草書手寫體漢字的一種比較有效的方法是,對聯(lián)機(jī)手寫漢字使用虛擬筆畫技術(shù)后再提取漢字的點(diǎn)特征。虛擬筆畫技術(shù)最早由日本學(xué)者M(jìn).Okamoto等人提出,方法是采用虛擬的點(diǎn)將所有筆畫連接在一起,目的是模擬人的草書習(xí)慣,統(tǒng)一手寫漢字的風(fēng)格。虛擬筆畫技術(shù)雖然起到一定效果,但已經(jīng)被證實(shí)會(huì)損失相當(dāng)一部分漢字的識(shí)別率,有待改進(jìn)。
發(fā)明內(nèi)容
本發(fā)明的目的在于克服現(xiàn)有技術(shù)的不足,提供一種使得識(shí)別結(jié)構(gòu)精確度較高的用于聯(lián)機(jī)手寫漢字識(shí)別的筆畫特征提取方法,特別是用于聯(lián)機(jī)手寫草書字體識(shí)別的筆畫特征提取方法。
為了實(shí)現(xiàn)上述發(fā)明目的,采用的技術(shù)方案如下:
一種用于聯(lián)機(jī)手寫漢字識(shí)別的漢字筆畫特征提取方法,包括如下步驟:
(1)對聯(lián)機(jī)手寫漢字的時(shí)間序列進(jìn)行真實(shí)筆畫和虛擬筆畫處理,即在所有相鄰且斷開的真實(shí)筆畫間加入虛擬筆畫,構(gòu)成一個(gè)連續(xù)的書寫軌跡,得到有虛擬筆畫的時(shí)間序列,同時(shí)保留不添加任何虛擬筆畫點(diǎn)的時(shí)間序列副本,即無虛擬筆畫的時(shí)間序列;
(2)根據(jù)步驟(1)得到的有虛擬筆畫的時(shí)間序列和無虛擬筆畫的時(shí)間序列,對屬于真實(shí)筆畫的點(diǎn)和屬于虛擬筆畫的點(diǎn)加以區(qū)分,即記下每個(gè)點(diǎn)是屬于真實(shí)筆畫點(diǎn)還是虛擬筆畫點(diǎn);
(3)對步驟(2)的兩個(gè)時(shí)間序列,采用如下方法產(chǎn)生最終的筆畫特征:
(31)定義二維平面內(nèi)的八種方向,即東、西、南、北、東南、西南、東北和西北,計(jì)算每個(gè)時(shí)間序列中每一點(diǎn)的方向特征,點(diǎn)的方向特征定義從當(dāng)前點(diǎn)的前驅(qū)到后續(xù)的一個(gè)矢量,令屬于真實(shí)筆畫的點(diǎn)的特征矢量,則將改變成k是對真實(shí)筆畫點(diǎn)的特征矢量的一個(gè)加權(quán)系數(shù);如果是屬于虛擬筆畫的點(diǎn)的特征矢量,則保持不變;最后將加權(quán)處理后的每一點(diǎn)的方向特征映射到平面內(nèi)的八個(gè)方向,得到八個(gè)方向的模式圖像,映射的方法是分解點(diǎn)特征矢量到最鄰近的兩個(gè)方向;
(32)把每個(gè)時(shí)間序列看成一幅圖像,通過把漢字圖像在水平和垂直兩個(gè)方向上的直方圖投影畫出8×8的全局彈性網(wǎng)格,使得每一列網(wǎng)格在水平方向上的直方圖投影累積量相等,每一行網(wǎng)格在垂直方向上的直方圖投影累積量相等,根據(jù)這64個(gè)彈性網(wǎng)格,在步驟(31)中得到八個(gè)模式圖像中提取網(wǎng)格特征,每一個(gè)序列都可以得到512維的特征矢量。
本發(fā)明所述步驟(1)在進(jìn)行真實(shí)筆畫和虛擬筆畫處理之前還包括對聯(lián)機(jī)手寫漢字的時(shí)間序列進(jìn)行如下的預(yù)處理步驟:
線性歸一化,用比值線性歸一化的方法,把時(shí)間序列歸一化到固定的64×64像素的尺寸。預(yù)處理步驟是為了消除不同用戶書寫同一漢字的區(qū)別,對于不同的用戶,書寫出來的同一個(gè)漢字會(huì)有很大的不同,預(yù)處理的目的是盡可能去除同一類別中不同漢字樣本的差別。
本發(fā)明所述步驟(1)在進(jìn)行真實(shí)筆畫和虛擬筆畫處理之后還包括對得到的有虛擬筆畫的時(shí)間序列和無虛擬筆畫的時(shí)間序列進(jìn)行重采樣,將每個(gè)樣本的數(shù)據(jù)采樣點(diǎn)序列用固定的距離重新采樣。重采樣的目的是減少歸一化后漢字樣本數(shù)據(jù)中連續(xù)點(diǎn)的距離的變化和一個(gè)筆畫的采樣點(diǎn)的數(shù)目變化。同樣可消除不同用戶書寫同一漢字的區(qū)別。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華南理工大學(xué),未經(jīng)華南理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200910041047.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 與服務(wù)器間斷線自動(dòng)重連方法
- 切換網(wǎng)絡(luò)聯(lián)機(jī)裝置的方法及網(wǎng)絡(luò)聯(lián)機(jī)系統(tǒng)
- 藍(lán)牙輔助聯(lián)機(jī)建立方法與無線存取點(diǎn)裝置
- 支持點(diǎn)對點(diǎn)聯(lián)機(jī)的無線通信裝置與方法
- 一種基于并聯(lián)機(jī)構(gòu)的復(fù)雜路面搬運(yùn)機(jī)器人
- 一種套疊式超冗余串并聯(lián)變剛度擺動(dòng)推進(jìn)裝置
- 一種透過偵測聯(lián)機(jī)編碼進(jìn)行無線訊號(hào)聯(lián)機(jī)的系統(tǒng)
- 一種應(yīng)用程序測試方法及終端設(shè)備
- 一種混聯(lián)機(jī)器人工作空間的求解方法
- 終端設(shè)備的聯(lián)機(jī)方法及裝置、聯(lián)機(jī)系統(tǒng)、存儲(chǔ)介質(zhì)
- 一種能光學(xué)表現(xiàn)平面手寫面上書寫信息的工具
- 通過使用手寫數(shù)據(jù)再現(xiàn)手寫消息的裝置和方法
- 一種手寫筆跡電子化方法和系統(tǒng)
- 一種發(fā)送手書消息和再現(xiàn)手書消息的方法
- 一種新型無線手寫板
- 一種手寫能力量化評(píng)估系統(tǒng)及方法
- 手寫內(nèi)容去除方法、手寫內(nèi)容去除裝置、存儲(chǔ)介質(zhì)
- 文本圖像中手寫內(nèi)容去除方法、裝置、存儲(chǔ)介質(zhì)
- 一種手寫識(shí)別方法、裝置、電子設(shè)備及介質(zhì)
- 第三方手寫軟件快速手寫的實(shí)現(xiàn)方法、電子設(shè)備及存儲(chǔ)介質(zhì)





