[發明專利]一種詞處理的方法及相關裝置在審
| 申請號: | 201911330907.3 | 申請日: | 2019-12-20 |
| 公開(公告)號: | CN113010665A | 公開(公告)日: | 2021-06-22 |
| 發明(設計)人: | 王丹;崔欣 | 申請(專利權)人: | 北京搜狗科技發展有限公司 |
| 主分類號: | G06F16/335 | 分類號: | G06F16/335;G06F16/338;G06F3/023 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 柳欣 |
| 地址: | 100084 北京市海淀區中關*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 處理 方法 相關 裝置 | ||
1.一種詞處理的方法,其特征在于,包括:
獲得目標用戶安裝的目標應用程序;
基于所述目標應用程序的特征詞更新所述目標用戶的輸入法詞庫;所述目標應用程序的特征詞是基于所述目標應用程序對應的用戶語料和/或自定義語料預先挖掘獲得的。
2.根據權利要求1所述的方法,其特征在于,所述目標應用程序的特征詞的獲得步驟包括:
針對所述目標應用程序,收集所述用戶語料和/或所述自定義語料;
基于預設挖掘策略挖掘所述用戶語料和/或所述自定義語料,獲得所述目標應用程序的特征詞。
3.根據權利要求2所述的方法,其特征在于,所述基于預設挖掘策略挖掘所述用戶語料和/或所述自定義語料,獲得所述目標應用程序的特征詞,包括:
統計所述用戶語料和/或所述自定義語料中各個分詞的詞頻-逆文件頻率;
基于各個所述分詞的詞頻-逆文件頻率和預設詞頻-逆文件頻率,篩選獲得所述目標應用程序的特征詞。
4.根據權利要求3所述的方法,其特征在于,所述基于各個所述分詞的詞頻-逆文件頻率和預設詞頻-逆文件頻率,篩選獲得所述目標應用程序的特征詞,包括:
選取所述詞頻-逆文件頻率大于等于所述預設詞頻-逆文件頻率的分詞形成目標分詞集合;
基于預設標記詞表過濾所述目標分詞集合,獲得所述目標應用程序的特征詞。
5.根據權利要求1所述的方法,其特征在于,在所述獲得目標用戶安裝的目標應用程序之后,所述基于所述目標應用程序的特征詞更新所述目標用戶的輸入法詞庫之前,還包括:
獲得所述目標應用程序的使用情況;
對應地,所述基于所述目標應用程序的特征詞更新所述目標用戶的輸入法詞庫,具體為:
若所述目標應用程序的使用情況滿足預設條件,基于所述目標應用程序的特征詞更新所述目標用戶的輸入法詞庫;
其中,所述使用情況包括使用頻次,對應地,所述預設條件為所述使用頻次大于等于預設使用頻次;所述使用情況包括使用時間,對應地,所述預設條件為所述使用時間大于等于預設使用時間。
6.根據權利要求1所述的方法,其特征在于,在所述獲得目標用戶安裝的目標應用程序之后,所述基于所述目標應用程序的特征詞更新所述目標用戶的輸入法詞庫之前,還包括:
向所述目標用戶展示所述目標應用程序的特征詞的更新權限提示框。
7.根據權利要求1所述的方法,其特征在于,在所述基于所述目標應用程序的特征詞更新所述目標用戶的輸入法詞庫之后,還包括:
獲取所述目標用戶的輸入數據;
若所述目標用戶的輸入數據與所述目標應用程序的特征詞匹配,直接將所述目標應用程序的特征詞展示給所述目標用戶。
8.一種詞處理的裝置,其特征在于,包括:
第一獲得單元,用于獲得目標用戶安裝的目標應用程序;
更新單元,用于基于所述目標應用程序的特征詞更新所述目標用戶的輸入法詞庫;所述目標應用程序的特征詞是基于所述目標應用程序對應的用戶語料和/或自定義語料預先挖掘獲得的。
9.一種用于詞處理的裝置,其特征在于,包括有存儲器,以及一個或者一個以上的程序,其中一個或者一個以上程序存儲于存儲器中,且經配置以由一個或者一個以上處理器執行所述一個或者一個以上程序包含用于進行以下操作的指令:
獲得目標用戶安裝的目標應用程序;
基于所述目標應用程序的特征詞更新所述目標用戶的輸入法詞庫;所述目標應用程序的特征詞是基于所述目標應用程序對應的用戶語料和/或自定義語料預先挖掘獲得的。
10.一種機器可讀介質,其上存儲有指令,當由一個或多個處理器執行時,使得裝置執行如權利要求1至7中任一項所述的詞處理的方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京搜狗科技發展有限公司,未經北京搜狗科技發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911330907.3/1.html,轉載請聲明來源鉆瓜專利網。





