[發明專利]輸入法的詞庫數據矯正方法和裝置有效
| 申請號: | 201210098791.7 | 申請日: | 2012-04-06 |
| 公開(公告)號: | CN103365905B | 公開(公告)日: | 2017-12-15 |
| 發明(設計)人: | 查文 | 申請(專利權)人: | 深圳市世紀光速信息技術有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F3/023 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司11319 | 代理人: | 蘇培華 |
| 地址: | 廣東省深圳市南山區高*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 輸入法 詞庫 數據 矯正 方法 裝置 | ||
技術領域
本發明涉及數據處理設備的文字輸入技術,尤其涉及一種文字輸入法的詞語數據庫(簡稱詞庫)數據的矯正方法和裝置。
背景技術
數據處理設備如計算機、智能手機等已經大量應用在人們的生產和生活中。數據處理設備的一種重要的功能是對文字的處理。因此各種文字輸入法運用而生。
所述文字輸入法通常被制作成文字輸入法軟件,文字輸入法軟件通常的文字輸入過程是:(1)用戶啟動輸入法軟件;(2)用戶通過鍵盤操作向輸入法軟件輸入編碼,所述編碼如漢字輸入中的拼音編碼、字根編碼,英文輸入中的字符編碼等;(3)輸入法軟件將輸入的編碼轉換為候選文字顯示在候選框內;(4)用戶選擇候選框內的文字,觸發上屏鍵,通常的上屏鍵如空格鍵、回車鍵、數字選擇鍵等;(5)輸入法軟件將用戶選擇的文字輸入顯示到數據處理設備屏幕上的光標位置,這一將選中的文字輸入顯示到屏幕的操作也叫做“上屏”,每次通過所述步驟(2)至步驟(5)的操作輸入到屏幕上的文字被稱為一次“上屏文字”。
在輸入法中,通常使用詞庫來記錄用戶通過輸入法軟件輸入的上屏文字。通常每一次上屏操作的上屏文字都要作為一個學詞計入詞庫。詞庫中包括每一上屏文字對應的學詞及其計入次數,業界通常形象地將一個上屏文字作為一個學詞計入詞庫的過程叫做“學習入庫”過程。輸入法軟件根據詞庫中學詞的計入次數決定后續在相同條件下優先選擇計入次數多的學詞,并優先展示在候選區。
在輸入文字的過程中,往往由于輸入錯誤需要對輸入過的文字進行修改,并對詞庫中的學詞進行相應的矯正。現有文字輸入法的詞庫數據矯正方法通常有兩種。
圖1為現有技術一的文字輸入法的詞庫數據矯正方法的一種流程圖。參見圖1,該方法包括:每輸入一次上屏文字后,將本次上屏文字存入一臨時緩存中,之后判斷是否繼續輸入了下一上屏文字,如果輸入了,則判定確認了該臨時緩存中的該上屏文字為學詞,將該臨時緩存中的該上屏文字作為學詞計入詞庫;如果沒有繼續輸入下一上屏文字,而是進行了其他的修改操作,則清除所述臨時緩存中的上屏文字。
圖2為現有技術二的文字輸入法軟件的詞庫數據矯正方法的一種流程圖。參見圖2,該方法不需要臨時緩存,而是每輸入一次上屏文字后,就將該上屏文字作為學詞計入詞庫,例如輸入一次上屏文字“劉遠方”,就將“劉遠方”作為學詞計入詞庫,之后再判斷用戶是否退格修改,如果是則回滾上次學詞,所謂回滾就是撤銷最近計入詞庫的學詞,所述撤銷就是說如果該上屏文字第一次計入詞庫則從詞庫中刪除,如果不是第一次計入詞庫則降低該學詞的計入次數;如果用戶沒有退格修改,則繼續輸入下一上屏文字。
上述現有技術盡管可以在一定程度上避免學習錯誤的詞,但有如下缺點:
1)在用戶利用輸入法軟件輸入文字過程中,經常會有輸入錯誤的情況,比如上屏文字“劉遠方”,如果用戶發現出錯了,這個人其實叫“劉元芳”,此時,用戶按退格鍵刪除“遠方”重新輸入“元芳”。按照現有技術一的方式則清除臨時緩存中的“劉遠方”,在上屏“元芳”并確認后將“元芳”作為學詞計入詞庫。按照現有技術二的方法則撤銷已經計入詞庫的學詞“劉遠方”,重新將“元芳”作為學詞計入詞庫。但是,上述現有技術雖然沒有向詞庫計入錯誤的學詞“劉遠方”,但是也沒有向詞庫計入正確的學詞“劉元芳”,而是又向詞庫計入了錯誤的學詞“元芳”。因此,導致詞庫數據矯正的正確率較低,往往不能向詞庫計入正確的學詞。
2)如果用戶已經持續輸入了一段時間,比如輸入“劉遠方|見義勇為|的|故事”(其中|代表分次上屏操作的過程)后,此時才發現“遠方”的錯誤,此時用戶進行退回操作,并將“遠方”改為“元芳”,但是,按照上述現有技術的方案卻無法在詞庫中矯正撤銷“劉遠方”這個錯誤的學詞,因為后續最近一次輸入的“見義勇為”確認了前面上屏的“劉遠方”,已經將這個上屏文字作為學詞計入了詞庫。而真正撤銷的是最近一次上屏的上屏文字“故事”,這顯然是錯誤的,而且又向詞庫計入了錯誤的學詞“元芳”。因此,在用戶更改前文輸入的文字時,詞庫數據矯正會出現錯誤,詞庫數據矯正的正確率較低。
發明內容
有鑒于此,本發明的主要目的在于提供一種文字輸入法的詞庫數據矯正方法和裝置,以提高詞庫數據矯正的正確率。
本發明的技術方案是這樣實現的:
一種文字輸入法的詞庫數據矯正方法,包括:
將每次輸入上屏的上屏文字記錄到記錄區,在該記錄區內相互區分每次上屏的上屏文字,同時在該記錄區同步屏幕上的光標位置和修改操作;
將每次上屏的上屏文字作為學詞計入詞庫;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市世紀光速信息技術有限公司,未經深圳市世紀光速信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210098791.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:電力系統的運行風險評估方法
- 下一篇:經緯編織易洗面料
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





