[發(fā)明專利]一種手寫識別方法及系統(tǒng)無效
| 申請?zhí)枺?/td> | 201010223528.7 | 申請日: | 2010-06-30 |
| 公開(公告)號: | CN101894266A | 公開(公告)日: | 2010-11-24 |
| 發(fā)明(設計)人: | 李健;張連毅;武衛(wèi)東 | 申請(專利權)人: | 北京捷通華聲語音技術有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06K9/72 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 蘇培華 |
| 地址: | 100193 北京市海淀區(qū)東北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 手寫 識別 方法 系統(tǒng) | ||
技術領域
本發(fā)明涉及手寫識別技術領域,特別是涉及一種手寫識別方法及系統(tǒng)。
背景技術
手寫識別技術是指通過手寫板等軌跡捕獲設備獲得書寫者的書寫信息,將手寫軌跡信息轉換輸入計算機。用戶在手寫板和觸摸屏上書寫的筆畫以坐標序列的形式被計算機存儲下來,通過對文字圖像的抬筆、落筆、筆跡上各像素的空間位置等信息進行處理與對照,系統(tǒng)將數據轉化為計算機所使用的文字編碼進行輸出。
在手寫輸入過程中,對同一個漢字不同人有不同的書寫筆順(倒插筆書寫),有些人還習慣連筆書寫,因此手寫識別系統(tǒng)需要解決這些倒插筆書寫和連筆書寫的問題。
一般的解決方法是:用多個識別引擎來共同決策,有的引擎在倒插筆書寫時能給出較好的識別結果,有的引擎在連筆書寫時能給出較好的識別結果,通過將多個引擎的識別結果綜合打分,最終給出識別結果。這種決策方法能夠在很大程度上綜合多個引擎的優(yōu)點,從而解決倒插筆或連筆識別問題。
但是,這種方法存在以下缺點:有些情況下,當多個引擎共同決策時,結果反而不正確。這是因為每個引擎在識別時的側重點不同,有的引擎對連筆書寫(筆順都是正確的)的字符能有很高的識別率,但對筆順錯誤的字符就不能正確識別;有的引擎對字符筆順不敏感,筆順是否錯誤并不影響識別率,但對是否正楷書寫比較敏感,連筆書寫字符的識別效果會差一些。當多個引擎共同決策時,根據各個識別結果綜合考慮,給出結果。例如,輸入一個筆順正確、非常潦草的“建”字,連筆引擎識別結果正確,但無筆順引擎識別錯誤,兩者綜合考慮,最終識別結果可能會錯誤。再例如,輸入一個正楷書寫但筆順錯誤的“訊”字,無筆順引擎識別正確,但連筆引擎識別結果錯誤,兩者綜合考慮,最終識別結果也可能會錯誤。
發(fā)明內容
本發(fā)明所要解決的技術問題是提供一種手寫識別方法及系統(tǒng),以解決多引擎共同識別存在識別錯誤的問題。
為了解決上述問題,本發(fā)明公開了一種手寫識別方法,包括:
使用單個識別引擎進行手寫識別,得到識別結果;
判斷單個識別引擎的識別結果是否符合對應的預置條件,如果符合,則結束識別;如果不符合,則繼續(xù)使用另一單個識別引擎進行識別;
如果所有單個識別引擎的識別結果都不符合相應的預置條件,則進行綜合決策。
優(yōu)選的,所述識別結果包括字符編碼和識別距離。
優(yōu)選的,所述判斷單個識別引擎的識別結果是否符合對應的預置條件,包括:判斷識別距離是否小于該單個識別引擎對應的置信閾值,如果小于,則符合;否則,不符合。
其中,通過以下方式獲得單個識別引擎對應的置信閾值:從訓練樣本中提取特征,所述特征包括字符編碼和識別距離;根據提取出的特征進行模型訓練,得到對應該單個識別引擎的置信閾值。
優(yōu)選的,所述提取出的特征分為正確識別的特征和錯誤識別的特征,則所述置信閾值是根據正確識別的特征進行模型訓練得到,或者是根據錯誤識別的特征進行模型訓練得到。
其中,所述進行綜合決策包括:對所有單個識別引擎的識別結果進行加權平均,得到最終識別結果。
本發(fā)明還提供了一種手寫識別系統(tǒng),包括:
多個單個識別引擎,用于進行手寫識別,得到識別結果;
引擎選擇器,用于判斷單個識別引擎的識別結果是否符合對應的預置條件,如果符合,則結束識別;如果不符合,則繼續(xù)觸發(fā)另一單個識別引擎進行識別;
綜合決策模塊,用于當所有單個識別引擎的識別結果都不符合相應的預置條件時,進行綜合決策。
優(yōu)選的,所述識別結果包括字符編碼和識別距離;則所述引擎選擇器判斷單個識別引擎的識別距離是否小于該單個識別引擎對應的置信閾值,如果小于,則符合對應的預置條件;否則,不符合。
其中,所述單個識別引擎還用于從訓練樣本中提取特征,所述特征包括字符編碼和識別距離;所述系統(tǒng)還包括:模型訓練模塊,用于根據提取出的特征進行模型訓練,得到對應該單個識別引擎的置信閾值。
優(yōu)選的,所述單個識別引擎提取出的特征分為正確識別的特征和錯誤識別的特征,則所述置信閾值是模型訓練模塊根據正確識別的特征進行模型訓練得到,或者是根據錯誤識別的特征進行模型訓練得到。
與現有技術相比,本發(fā)明具有以下優(yōu)點:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京捷通華聲語音技術有限公司,未經北京捷通華聲語音技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010223528.7/2.html,轉載請聲明來源鉆瓜專利網。





