[發明專利]一種更新用戶詞庫的方法及裝置有效
| 申請號: | 200710302282.0 | 申請日: | 2007-12-24 |
| 公開(公告)號: | CN101178741A | 公開(公告)日: | 2008-05-14 |
| 發明(設計)人: | 陳麗菲 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/00 |
| 代理公司: | 北京德琦知識產權代理有限公司 | 代理人: | 羅正云;宋志強 |
| 地址: | 518044廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 更新 用戶 詞庫 方法 裝置 | ||
技術領域
本發明涉及輸入法,特別涉及一種更新用戶詞庫的方法及裝置。
背景技術
隨著電子科技的發展,輸入法在各個領域都得到了廣泛的應用,提供一款準確、快速且人性化的輸入法,是很多開發商關注的問題。
目前被廣泛使用的輸入法一般通過以下步驟實現字符輸入:
首先由用戶輸入指令符,系統根據指令符從用戶詞庫中篩選出指令符所對應的候選詞,將候選詞根據長詞優先原則以及用戶輸入習慣進行排序并呈現給用戶,最終由用戶選擇需要的候選詞作為輸入字符輸入。這樣,就完成了一次字符輸入。這里所述的指令符可以為拼音,所述字符可以為中文詞語,所述中文詞語可以為單個漢字,也可以為多個漢字組成的詞。當然,指令符和字符有很多種,比如在日文輸入中,日文拼寫的指令符對應的字符為日文。
用戶輸入習慣存儲在用戶詞庫中,在用戶詞庫中,中每一個字符都有其對應的用戶輸入習慣,用戶輸入習慣包括最后記憶和詞頻。所述最后記憶是指,用戶最后一次輸入某個指令符之后,選擇了一個輸入字符,那么這個輸入字符就是這個指令符的最后記憶。所述詞頻是指,字符被用戶輸入過的次數。
在用戶每輸入一次字符之后,系統會進行用戶詞庫更新,這里所述用戶詞庫更新包括:更新所述輸入字符在用戶詞庫中對應的用戶輸入習慣。
更新用戶輸入習慣包括最后記憶的更新和詞頻的更新。
所述最后記憶的更新是指:用戶每輸入一次指令符并在系統根據所述指令符生成的候選詞中選擇一次字符,系統都會將用戶輸入的指令符與用戶選擇的字符記錄下來,將所述字符作為所述指令符的最后記憶存入用戶詞庫中。在接下來的輸入中,如果用戶再次輸入這個指令符,系統首先會根據所述指令符篩選出候選詞,再將候選詞進行排序,那么在排序的過程中,會優先考慮所述指令符的最后記憶。
所述詞頻的更新是指:對于每個被用戶輸入過的字符,系統都在用戶詞庫中會記錄該字符以及該字符被用戶輸入過該詞的次數,這個被用戶輸入過的次數就為所述字符的詞頻。在輸入的過程中,用戶每輸入一次字符,系統就會判斷所述字符在之前是否被輸入過,如果是,則將用戶詞庫中所述字符的詞頻加一,否則,將所述字符添加到用戶詞庫中。在之后的輸入中,如果用戶輸入了一個指令符,系統首先會從用戶詞庫中篩選出所述指令符對應的所有字符,然后將篩選出的字符進行排序,那么在排序的過程中,系統在優先考慮了所述指令符的最后記憶之后,會進一步再根據候選詞的詞頻進行排序,詞頻高的候選詞排在前面,詞頻低的排在后面。
舉例來說,用戶第一次輸入拼音“nh”,然后選擇了“你好”,那么系統會判斷“你好”在之前有沒有被輸入過,如果是,則將用戶詞庫中“你好”的詞頻加一,否則,將“你好”添加在用戶詞庫中;同時系統還會將“nh”的最后記憶更新為“你好”,這里需要說明的是,如果用戶下一次再輸入“nh”,選擇了“女孩”,那么系統會將“nh”的最后記憶更新為“女孩”。
由此可見,用戶詞庫中不斷更新的用戶輸入習慣會影響到候選詞的排序,而候選詞的排序直接關系到用戶使用輸入法進行字符輸入的準確性和速度,因此對輸入法的準確性及可靠性都有著至關重要的作用。
然而在實際應用中,用戶詞庫的更新會存在這樣的情況:
用戶輸入指令符之后,由于在候選詞選擇的過程中選擇失誤,將錯誤的候選詞作為了輸入字符輸入,那么系統會在用戶詞庫中將這個被錯誤輸入的字符的詞頻加一并將用戶輸入的指令符的最后記憶更新為這個被錯誤輸入的字符,這使得用戶詞庫更新中,用戶輸入習慣被更新錯誤。
接下來,用戶在輸入錯誤之后,可能會馬上發現并刪除這個由于候選詞選擇錯誤而被錯誤輸入的字符,然后在所述被刪除的字符原來所在的位置重新輸入指令符并最終選擇正確的候選詞作為輸入字符輸入,這里我們稱這個正確的輸入字符為之前被刪除的字符的更正字符。重新輸入的指令符可能會與之前輸入的指令符有所不同,比如用戶在候選詞選擇錯誤的時候采用的是簡拼,而發現錯誤后,為了提高準確性,在輸入更正字符時選擇全拼,但是兩次輸入的指令符所候選詞中,都是包括所述更正字符的。
然而在上述過程結束后,被更新錯誤的用戶習慣始終不會得到更正,如果用戶再次輸入了當時輸入錯誤字符時對應的指令符,系統會根據用戶詞庫中錯誤的詞頻和最后記憶對篩選出的候選詞進行排序,進而導致排序錯誤,這會給用戶接下來根據候選詞排序來選擇需要的字符帶來不必要的干擾,降低了輸入字符的準確性和速度。
發明內容
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200710302282.0/2.html,轉載請聲明來源鉆瓜專利網。





