[發(fā)明專利]脫機手寫漢字的筆畫還原方法及裝置有效
| 申請?zhí)枺?/td> | 201410291358.4 | 申請日: | 2014-06-25 |
| 公開(公告)號: | CN104063723B | 公開(公告)日: | 2017-06-06 |
| 發(fā)明(設(shè)計)人: | 荀恩東;呂曉晨;孫燕南 | 申請(專利權(quán))人: | 北京語言大學(xué) |
| 主分類號: | G06K9/68 | 分類號: | G06K9/68 |
| 代理公司: | 北京三友知識產(chǎn)權(quán)代理有限公司11127 | 代理人: | 王天堯 |
| 地址: | 100083*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 脫機 手寫 漢字 筆畫 還原 方法 裝置 | ||
1.一種脫機手寫漢字的筆畫還原方法,其特征在于,包括:
獲取脫機手寫漢字的各個筆段和預(yù)設(shè)模板漢字的各個筆段,其中,所述筆段是將漢字分割成的線段;
將脫機手寫漢字的各個筆段與預(yù)設(shè)模板漢字的各個筆段的有序序列進(jìn)行匹配,生成脫機手寫漢字的各個筆段的筆段序列,其中,筆段序列以書寫脫機手寫漢字的筆段時序為順序,預(yù)設(shè)模板漢字的各個筆段的有序序列以書寫所述預(yù)設(shè)模板漢字時預(yù)設(shè)模板漢字的各個筆段的時序為順序;
根據(jù)生成的筆段序列進(jìn)行所述脫機手寫漢字的筆畫還原;
在將所述脫機手寫漢字的各個筆段與預(yù)設(shè)模板漢字的各個筆段的有序序列進(jìn)行匹配之前,還包括:
建立預(yù)設(shè)模板漢字庫,所述預(yù)設(shè)模板漢字庫存儲預(yù)設(shè)模板漢字的結(jié)構(gòu)、筆畫和筆段,其中,存儲預(yù)設(shè)模板漢字的結(jié)構(gòu)、筆畫和筆段的順序分別為書寫預(yù)設(shè)模板漢字時結(jié)構(gòu)、筆畫和筆段的時序;
將所述脫機手寫漢字的各個筆段與預(yù)設(shè)模板漢字的各個筆段的有序序列進(jìn)行匹配,生成所述筆段序列,包括:
從所述預(yù)設(shè)模板漢字庫中確定出與所述脫機手寫漢字相對應(yīng)的預(yù)設(shè)模板漢字;
對所述脫機手寫漢字的各個筆段任意合并和排序,生成多個筆段序列;
計算多個筆段序列中每個筆段序列與確定出的預(yù)設(shè)模板漢字的各個筆段的有序序列之間的相似度;
確定多個筆段序列中相似度最高的序列為所述筆段序列;
計算多個筆段序列中每個筆段序列與確定出的預(yù)設(shè)模板漢字的各個筆段的有序序列之間的相似度,包括:
針對有序序列中的每個筆段,計算每個筆段序列中每個筆段與該筆段的相似度,并將每個筆段序列中相似度小于預(yù)設(shè)閾值的筆段加入該筆段的筆段候選集合,該筆段的筆段候選集合中包括所述每個筆段序列中的筆段或所述每個筆段序列中筆段的組合;
根據(jù)有序序列中各個筆段的順序,將每個筆段的筆段候選集合中的筆段或筆段組合組成筆段序列,并通過估算函數(shù)計算組成的筆段序列的估算函數(shù)值,其中,估算函數(shù)值的大小與相似度成比例。
2.如權(quán)利要求1所述脫機手寫漢字的筆畫還原方法,其特征在于,脫機手寫漢字的各個筆段是以筆畫的起始點、終點、拐點以及筆畫間的交叉點為分割點,將漢字分割成的線段;和/或,
預(yù)設(shè)模板漢字的各個筆段是以筆畫的起始點、終點以及拐點為分割點,將預(yù)設(shè)模板漢字分割成的線段。
3.如權(quán)利要求1所述脫機手寫漢字的筆畫還原方法,其特征在于,獲取脫機手寫漢字的各個筆段,包括:
獲取所述脫機手寫漢字的靜態(tài)圖像;
從所述靜態(tài)圖像中獲取所述脫機手寫漢字的各個筆段。
4.如權(quán)利要求3所述脫機手寫漢字的筆畫還原方法,其特征在于,從所述靜態(tài)圖像中獲取所述脫機手寫漢字的各個筆段,包括:
去除所述靜態(tài)圖像中的噪聲信息和對所述脫機手寫漢字的邊緣進(jìn)行平滑;
從去除噪聲信息和對所述脫機手寫漢字的邊緣進(jìn)行平滑后的靜態(tài)圖像中,獲取表示所述脫機手寫漢字的拓?fù)浣Y(jié)構(gòu)的字形骨架;
從所述字形骨架中獲取所述脫機手寫漢字的各個筆段。
5.如權(quán)利要求4所述脫機手寫漢字的筆畫還原方法,其特征在于,在從所述字形骨架中獲取所述脫機手寫漢字的各個筆段之前,還包括:
根據(jù)預(yù)設(shè)消岐規(guī)則,消除所述字形骨架中相對于所述脫機手寫漢字的拓?fù)浣Y(jié)構(gòu)存在的歧義變形。
6.如權(quán)利要求5所述脫機手寫漢字的筆畫還原方法,其特征在于,所述預(yù)設(shè)消岐規(guī)則包括以下信息:關(guān)鍵點在所述脫機手寫漢字的字形骨架中的位置信息和狀態(tài)信息、衍生點在字形骨架中的位置信息、歧義變形的類型以及對出現(xiàn)的歧義變形的消除方式,其中,所述關(guān)鍵點必然存在于所述字形骨架中,所述衍生點是所述字形骨架中預(yù)計會出現(xiàn)歧義變形的點。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京語言大學(xué),未經(jīng)北京語言大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410291358.4/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





