[發明專利]輸入法候選詞推薦方法及裝置在審
| 申請號: | 202110743668.5 | 申請日: | 2021-07-01 |
| 公開(公告)號: | CN113360004A | 公開(公告)日: | 2021-09-07 |
| 發明(設計)人: | 沈哲吉;賈昌鑫;米坤;黃福林 | 申請(專利權)人: | 北京華宇信息技術有限公司 |
| 主分類號: | G06F3/023 | 分類號: | G06F3/023 |
| 代理公司: | 北京中索知識產權代理有限公司 11640 | 代理人: | 胡大成 |
| 地址: | 100084 北京市海淀區中關村*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 輸入法 候選 推薦 方法 裝置 | ||
1.一種輸入法候選詞推薦方法,其特征在于,包括以下步驟:
確定當前輸入位置;
獲取當前輸入位置前的詞組;
獲取輸入字符;
通過分字符模型,對所述輸入字符進行劃分,生成若干字符單元;
獲取對應若干字符單元中第一字符單元的第一字符候選詞組集;
根據當前輸入位置前的詞組,分別計算第一字符候選詞組集中若干候選詞在確定當前輸入位置前的詞組、確定第一字符的情況下的出現概率;
根據所述第一字符候選詞組集中若干候選詞在確定當前輸入位置前的詞組、確定對應第一字符的情況下的出現概率,以預設推薦策略排列若干候選詞。
2.如權利要求1所述的輸入法候選詞推薦方法,其特征在于,所述獲取當前輸入位置前的詞組,具體包括:
獲取當前輸入位置前的文本;
通過分詞模型,對所述文本進行分詞,生成若干分詞單元;
確定位置最后的分詞單元。
3.如權利要求2所述的輸入法候選詞推薦方法,其特征在于,所述根據當前輸入位置前的詞組,分別計算第一字符候選詞組集中若干候選詞在確定當前輸入位置前的詞組、對應第一字符的情況下的出現概率,具體包括:
輸入當前輸入位置前的詞組后接第一字符單元的概率、當前輸入位置前的詞組后接若干候選詞中的第一候選詞的概率至計算模型,得到第一候選詞在確定當前輸入位置前的詞組、對應第一字符的情況下的出現概率;
其中,所述計算模型表示為:
式中,wi-1代表當前輸入位置前的詞組,si代表第一字符單元,wi代表若干候選詞中的第一候選詞;P(wi|wi-1)代表當前輸入位置前的詞組后接第一候選詞的概率;P(si|wi-1)代表當前輸入位置前的詞組后接第一字符單元的概率。
4.如權利要求3所述的輸入法候選詞推薦方法,其特征在于,所述輸入法候選詞推薦方法還包括以下步驟:
如果當前輸入位置沒有文本,則根據第一字符候選詞組集中的若干候選詞詞頻,以預設推薦策略排列若干候選詞。
5.如權利要求1所述的輸入法候選詞推薦方法,其特征在于,所述輸入法候選詞推薦方法還包括以下步驟:
獲取輸入記錄中對應第一字符的輸入詞組;
獲取對應若干字符單元中第二字符單元的第二字符候選詞組集;
根據輸入記錄中對應第一字符的輸入詞組,分別計算第二字符候選詞組集中若干候選詞在確定對應第一字符的輸入詞組、確定第二字符的情況下的出現概率;
根據所述第二字符候選詞組集中若干候選詞在確定對應第一字符的輸入詞組、確定對應第二字符的情況下的出現概率,以預設推薦策略排列若干候選詞。
6.一種輸入法候選詞推薦裝置,其特征在于,所述輸入法候選詞推薦裝置包括:
第一獲取模塊,用于確定當前輸入位置;還用于獲取當前輸入位置前的詞組;
第二獲取模塊,用于獲取輸入字符;
分字符模塊,用于通過分字符模型,對所述輸入字符進行劃分,生成若干字符單元;
第三獲取模塊,用于獲取對應若干字符單元中第一字符單元的第一字符候選詞組集;
計算模塊,用于根據當前輸入位置前的詞組,分別計算第一字符候選詞組集中若干候選詞在確定當前輸入位置前的詞組、確定第一字符的情況下的出現概率;
排序模塊,用于根據所述第一字符候選詞組集中若干候選詞在確定當前輸入位置前的詞組、確定對應第一字符的情況下的出現概率,以預設推薦策略排列若干候選詞。
7.如權利要求6所述的輸入法候選詞推薦裝置,其特征在于,所述第一獲取模塊用于獲取當前輸入位置前的詞組,具體用于:
獲取當前輸入位置前的文本;
通過分詞模型,對所述文本進行分詞,生成若干分詞單元;
確定位置最后的分詞單元。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京華宇信息技術有限公司,未經北京華宇信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110743668.5/1.html,轉載請聲明來源鉆瓜專利網。





