[發明專利]一種聯機手寫句子實時識別方法有效
| 申請號: | 201010175627.2 | 申請日: | 2010-05-12 |
| 公開(公告)號: | CN101853126A | 公開(公告)日: | 2010-10-06 |
| 發明(設計)人: | 劉成林;王大寒 | 申請(專利權)人: | 中國科學院自動化研究所 |
| 主分類號: | G06F3/048 | 分類號: | G06F3/048;G06K11/06;G06K9/66 |
| 代理公司: | 中科專利商標代理有限責任公司 11021 | 代理人: | 梁愛榮 |
| 地址: | 100080 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 聯機 手寫 句子 實時 識別 方法 | ||
技術領域
本發明屬于計算機應用技術和模式識別領域,具體的說,涉及聯機手寫字符識別技術和手寫中文輸入方法。
背景技術
近幾年來,隨著筆式電腦、PDA和手機等移動終端設備的出現和越來越多地得到應用,聯機手寫字符輸入方法得到越來越多的關注。聯機手寫輸入,就是在書寫過程中用一個電子板或電子筆采集文字的筆劃軌跡(又稱數字墨水),然后對軌跡進行識別,將識別結果作為文本利用或保存起來。與常見的屏幕與鍵盤的輸入方式相比,筆輸入技術使用戶不必切換輸入設備、輸入模式或輸入軟件,僅僅用一支筆就可以實現輸入,與傳統的紙和筆的輸入方式更接近。手寫輸入方式對不會使用輸入法的人和不習慣使用鍵盤的人(比如老人),以及沒有鍵盤或鍵盤很小的情況(如手持式移動終端)提供了一種更方便有效的途徑。
聯機手寫輸入的核心是聯機手寫字符識別,字符識別準確率和速度直接決定了書寫的速度和效率。當前常用的方式是單個字的輸入,即輸入一個字,給出結束標志(提筆等待時間超過一定時間或者點擊按鈕),然后識別給出候選識別結果供用戶選擇,這使得輸入速度受到了很大的限制。手寫板、筆式電腦和大屏幕移動終端允許連續書寫多個字符,但是系統常常是在所有的筆劃寫完后才開始識別,這也使得識別速度受到限制,同時,現在的多字符識別技術切分錯誤較多、識別精度較低,影響了手寫輸入的效率。
手寫字符串(句子)識別是對一行字符或者一句話進行識別的,手寫句子識別在集成切分識別的框架下,可以有效融合字符識別器輸出、語言模型和幾何上下文信息,能提高字符切分和識別的準確率。在聯機手寫中文句子實時識別方面,即在句子書寫過程當中,系統對句子中已書寫的部分字符進行自動識別,并在句子書寫完成之后實時地給出整句識別結果,這方面的技術還沒有相關文獻或者專利的報道。
發明內容
為了解決現有技術的問題,本發明的目的是提供一種聯機手寫句子實時識別方法,該方法是基于聯機手寫字符串(句子)識別,在書寫過程當中對已書寫的部分字符進行自動識別,并在句子書寫完成之后實時地給出整句識別結果,解決了快速手寫中文輸入的問題。同時,本發明的聯機手寫句子識別方法,融合了字符識別置信度、幾何特征和語言模型,能提高手寫字符識別的精度;而基于與候選字符模式個數無關的路徑評價準則,使得利用動態規劃算法能快速搜索最優切分識別路徑得到識別結果;該方法的基本特征,還包括:利用統計語言模型和詞典進行詞語聯想,提高輸入速度;允許用戶對識別結果進行部分編輯修改。
為達成所述目的,本發明提供一種聯機手寫句子實時識別方法,是采用手寫句子實時識別、人工編輯修改和語言聯想相結合的方法,該方法主要有以下幾個模塊:實時識別、字符串識別(句子識別)、編輯修改和語言聯想,該識別方法的步驟包括:
步驟S1:輸入開始模塊啟動筆劃輸入,筆尖接觸輸入平面表明輸入開始;
步驟S2:筆劃采集模塊記錄筆尖在輸入平面上移動的筆劃軌跡;所述筆劃軌跡用xn,yn點坐標序列表示:(x1,y1),(x2,y2),...,(xn,yn),其中n是筆劃軌跡的采樣點數;
步驟S3:實時識別模塊對提筆后得到的筆劃軌跡進行處理,生成候選字符模式并對每一個候選字符模式進行識別給出候選字符類別,將生成的候選字符模式及其候選字符類別保存在候選切分識別網格;
步驟S4:提筆時間判斷模塊計算提筆時間是否夠長,如果提筆時間夠長表明提筆可能是一個字符的結束,執行步驟S5;如果提筆時間不夠長,表明提筆只是一個筆劃的結束,執行步驟S2,繼續采集下一個筆劃并進行實時識別;
步驟S5:啟動字符串識別模塊,字符串識別模塊根據路徑評價準則計算候選切分識別網格中各切分識別路徑的分數,并用動態規劃算法搜索分數最優的路徑得到字符串識別結果;字符串識別結果包括字符切分結果和字符識別結果;
步驟S6:編輯修改模塊對字符串識別結果進行編輯修改,對錯誤的字符切分和字符識別部分通過用戶操作進行編輯修改。
步驟S7:語言聯想模塊在字符串識別和編輯修改的基礎上,根據最后的字符類別,通過語言聯想給出后續的字或詞供用戶選擇,以提高句子輸入速度。
步驟S8:繼續輸入判斷模塊用于在聯想結束后判斷是否繼續輸入,如果繼續在輸入平面上書寫,則回到步驟S2采集下一個筆劃;否則,結束輸入。
其中,所述實時識別模塊包括以下步驟:
步驟S201:提筆表明一個筆劃書寫結束,得到筆劃軌跡或稱為點序列;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院自動化研究所,未經中國科學院自動化研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010175627.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:磁盤陣列處理方法
- 下一篇:設有電極的電容觸摸屏及其制造方法





