[發明專利]一種學詞方法和裝置有效
| 申請號: | 201110147255.7 | 申請日: | 2011-06-02 |
| 公開(公告)號: | CN102810095A | 公開(公告)日: | 2012-12-05 |
| 發明(設計)人: | 查文 | 申請(專利權)人: | 北京搜狗科技發展有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F3/023 |
| 代理公司: | 北京潤澤恒知識產權代理有限公司 11319 | 代理人: | 蘇培華 |
| 地址: | 100084 北京市海淀區中關*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 方法 裝置 | ||
技術領域
本發明涉及輸入法技術領域,特別是涉及一種學詞方法和裝置。
背景技術
隨著計算機技術以及互聯網技術的普及與發展,輸入法已經成為用戶與計算機交互的重要手段,不同專業領域、不同興趣以及使用習慣的用戶對于輸入法的智能性要求越來越高。
現有的輸入法一般通過提高系統詞庫中詞條的更新程度以及詞頻信息的準確度,來提高用戶輸入字符時的效率。
但是由于系統詞庫是相對固定的,針對每一個用戶而言,難以達到精確匹配;為了增強個性化的輸入效率,用戶詞庫應運而生,具體地,輸入法通過學詞,將用戶輸入的上屏詞(通過上屏動作后上屏的詞)存儲至用戶詞庫中。這里,上屏動作是指,在用戶通過輸入法確認輸入內容后,將輸入內容輸出到應用程序的動作。對于用戶詞庫中的詞條,輸入法還會根據用戶輸入這個詞條的次數和最后一次輸入這個詞條的時間來對詞條賦予一個屬性,稱為用戶詞頻。
在用戶進行輸入的時候,首先會從用戶詞庫中查找與輸入的編碼字符串相匹配的詞條,如果能直接命中,就返回用戶詞庫中的詞,否則再到系統詞庫中查找。因此,用戶詞庫的學詞可以在一定程度上調整候選項的排序,使其逐漸適應該用戶,從而提高輸入效率。
然而,在實際應用中,用戶詞庫的學詞會存在如下情況:用戶輸入編碼字符串后,由于候選詞選擇失誤而將錯誤的候選詞作為詞條學入用戶詞庫。例如,用戶欲通過編碼字符串“zhanglianfeng”輸入“張連鳳”,下意識按空格鍵上屏首選項“張連峰”,卻發現打錯字了;于是,按退格鍵刪除錯誤的“峰”字,以及,通過編碼字符串“feng”輸入正確的“鳳”字。
對于上述情況,是不應該將錯誤的候選詞作為詞條學入用戶詞庫的。于是,現有技術中,一種輸入法對學詞過程作了改進,參照圖1,所述學詞過程具體可以包括:
步驟101、接收用戶的上屏詞;
步驟102、將所述上屏詞作為詞條學入詞庫,并進行調頻;
步驟103、監視用戶的下一步動作;
步驟104、判斷用戶的下一步動作是否為退格鍵,若是,在執行步驟105,否則,執行步驟106;
步驟105、將用戶詞庫還原至上次上屏動作前的狀態;
步驟106、保留用戶詞庫中步驟102學入的詞條。
雖然上述學詞過程避免將錯誤的候選詞進入用戶詞庫。但由于其在判斷用戶輸入失誤后,就將用戶詞庫還原至上次上屏動作前的狀態,故拋棄了用戶真正輸入的內容。
對應前例,如果用戶欲輸入“張連鳳”,其在首次輸入上屏詞為“張連峰”,然后,通過刪除“峰”,補上“鳳”達到更正目的。在這種情況下,輸入法在刪除“峰”時對用戶詞庫進行了還原,本次輸入的“張連峰”不會學習到用戶詞庫中;同時,輸入“鳳”后會提高“鳳”的用戶詞頻;該用戶下次輸入“張連鳳”時,還會遇到困難,從而影響該用戶的輸入效率和輸入法的智能性。
總之,需要本領域技術人員迫切解決的一個技術問題就是:如何改變現有輸入法的智能性不高的現狀,提供一種能夠準確記錄用戶真正想要輸入的內容的學詞方法,大大提高用戶的輸入效率。
發明內容
本發明所要解決的技術問題是提供一種學詞方法和裝置,能夠提高學詞的智能性,從而提高用戶的輸入效率。
為了解決上述問題,本發明公開了一種學詞方法,包括:
記錄用戶輸入的至少一次上屏內容;
如果所述記錄的某次上屏內容的部分內容被用戶更改,對更改后的該次上屏內容進行學詞。
優選的,所述方法還包括:識別用戶動作,根據識別結果確定用戶是否對所述某次上屏內容的部分內容進行更改。
優選的,所述記錄用戶輸入的至少一次上屏內容包括:在緩存中保存用戶輸入的至少一次上屏內容;
所述方法還包括:如果識別出用戶更改了所述某次上屏內容的部分內容,則對應更改緩存中保存的該次上屏內容;
所述對更改后的上屏內容進行學詞包括:對緩存中更改后的該次上屏內容進行學詞。
優選的,所述識別用戶動作進一步包括:
記錄將某次上屏內容保存至緩存的時間,在所述時間后的設定時鐘周期內識別用戶針對該次上屏內容的動作;或者
將某次上屏內容保存至緩存后,記錄其后用戶輸入的上屏內容的次數N,在N小于設定數量時識別用戶針對該次上屏內容的動作。
優選的,所述方法還包括:刪除緩存中已進行學詞的所述上屏內容。
優選的,所述對緩存中更改后的上屏內容進行學詞包括:在用戶輸入下一個上屏內容后,對所述更改后的上屏內容進行學詞。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京搜狗科技發展有限公司,未經北京搜狗科技發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201110147255.7/2.html,轉載請聲明來源鉆瓜專利網。





