[發明專利]一種糾錯詞庫的建立方法和裝置有效
| 申請號: | 201710570569.5 | 申請日: | 2017-07-13 |
| 公開(公告)號: | CN109271037B | 公開(公告)日: | 2022-09-09 |
| 發明(設計)人: | 左艷波 | 申請(專利權)人: | 北京搜狗科技發展有限公司 |
| 主分類號: | G06F3/023 | 分類號: | G06F3/023 |
| 代理公司: | 深圳市深佳知識產權代理事務所(普通合伙) 44285 | 代理人: | 王仲凱 |
| 地址: | 100084 北京市海淀區中關*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 糾錯 詞庫 建立 方法 裝置 | ||
本申請實施例公開了一種糾錯詞庫的建立方法和裝置,該方法包括:識別用戶輸入字符串的輸入行為,所輸入的字符串對應至少一個候選字;若識別出用戶未選擇第一輸入行為中第一字符串對應的候選字,而選擇了第二輸入行為中第二字符串對應的候選字,保存第一字符串與第二字符串的對應關系,第二輸入行為是后于該第一輸入行為產生的、且與第一輸入行為相鄰產生的輸入行為,第一字符串在該第一輸入行為輸入字符串中所處的音節位置與第二字符串在該第二輸入行為輸入字符串中所處的音節位置相同;根據第一字符串與第二字符串的對應關系建立針對用戶的糾錯詞庫。可見,該糾錯詞庫可以有效的為用戶個性化的錯輸行為習慣進行糾錯,提高用戶的輸入效率。
技術領域
本申請涉及輸入法領域,特別是涉及一種糾錯詞庫的建立方法和裝置。
背景技術
用戶可以使用輸入法進行文字輸入,在一些語種例如漢語的輸入情況下,所需輸入的文字不能直接通過傳統的鍵盤輸入,而需要先輸入字符組成的字符串,然后再從輸入法根據字符串所提供的候選項中選擇所需輸入的文字。
用戶在使用輸入法輸入字符串時可能會出現輸錯的情況,即輸入的字符串與所需輸入文字對應的字符串不相符,例如輸入的字符串與所需輸入文字對應的字符串相比缺失了若干字符、字符先后關系改變,錯誤輸入的某些字符等。
輸錯了字符串可能導致對應該字符串的候選項中并沒有用戶所需的文字,為了能夠繼續文字的輸入,用戶需要修改所述輸錯了的字符串或者重新輸入字符串,降低了用戶的輸入體驗。
發明內容
為了解決上述技術問題,本申請提供了一種糾錯詞庫的建立方法和裝置,通過該糾錯詞庫可以有效的對該用戶輸入行為中輸錯的字符串進行糾錯。
第一方面,本申請提供了一種糾錯詞庫的建立方法,該方法包括:
識別用戶輸入字符串的輸入行為,所輸入的字符串對應至少一個候選字;
若識別出所述用戶未選擇第一輸入行為中第一字符串對應的候選字,而選擇了第二輸入行為中第二字符串對應的候選字,保存所述第一字符串與第二字符串的對應關系,所述第二輸入行為是后于所述第一輸入行為產生的、且與所述第一輸入行為相鄰產生的輸入行為,所述第一字符串在所述第一輸入行為輸入字符串中所處的音節位置與所述第二字符串在所述第二輸入行為輸入字符串中所處的音節位置相同;
根據所述第一字符串與第二字符串的對應關系建立針對所述用戶的糾錯詞庫。
可選的,所述保存第一字符串與第二字符串的對應關系,包括:
記錄識別出所述用戶未選擇第一輸入行為中第一字符串對應的候選字,而選擇了第二輸入行為中第二字符串對應的候選字的次數;
若所述次數滿足閾值,保存所述第一字符串與第二字符串的對應關系。
可選的,所述第二字符串為在所述第一輸入行為中所輸入第一字符串的基礎上修改得到的;或者
所述第二字符串為在取消了所述第一輸入行為所輸入字符串后輸入的。
可選的,所述方法還包括:
若獲取了所述用戶輸入的所述第一字符串,根據所述第一字符串從所述糾錯詞庫查詢得到所述第二字符串;
將所述第二字符串對應的候選字作為所述用戶輸入的所述第一字符串對應的候選字。
可選的,在對所述第一字符串對應的候選字進行展示時,所述方法還包括:
在所述第一字符串對應的候選字展示界面中的部分候選字展示位置展示所述第二字符串對應的候選字,所述候選字展示界面為用于展示候選字的界面,包括了多個候選字展示位置。
第二方面,本申請提供了一種糾錯詞庫的建立裝置,該裝置包括識別單元、保存單元和建立單元:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京搜狗科技發展有限公司,未經北京搜狗科技發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710570569.5/2.html,轉載請聲明來源鉆瓜專利網。





