[發明專利]一種詞庫管理方法及裝置在審
| 申請號: | 201810226154.0 | 申請日: | 2018-03-19 |
| 公開(公告)號: | CN110286775A | 公開(公告)日: | 2019-09-27 |
| 發明(設計)人: | 涂暢;周偉浩 | 申請(專利權)人: | 北京搜狗科技發展有限公司 |
| 主分類號: | G06F3/023 | 分類號: | G06F3/023 |
| 代理公司: | 北京華沛德權律師事務所 11302 | 代理人: | 馬苗苗 |
| 地址: | 100084 北京市海淀區中關*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 熱詞 聯想詞 詞庫管理 詞庫 預設 技術效果 候選詞 | ||
1.一種詞庫管理方法,其特征在于,包括:
基于第一用戶已輸入的內容,獲得至少一個熱詞,以及與所述熱詞相關的聯想詞;
將所述熱詞、以及所述聯想詞添加到預設詞庫中,以使得在第二用戶輸入所述熱詞時,能夠從所述預設詞庫中提取所述聯想詞,并將所述聯想詞作為所述熱詞的候選詞。
2.如權利要求1所述的詞庫管理方法,其特征在于,所述基于第一用戶已輸入的內容,獲得至少一個熱詞,以及與所述熱詞相關的聯想詞,包括:
基于第一用戶已輸入的內容,進行熱詞挖掘,獲得至少一個熱詞;
基于所述熱詞,挖掘出與所述熱詞相關的聯想詞。
3.如權利要求2所述的詞庫管理方法,其特征在于,所述基于第一用戶已輸入的內容,進行熱詞挖掘,獲得至少一個熱詞,包括:
統計全網用戶或預設群體用戶輸入的第一詞匯、以及每個第一詞匯對應的第一輸入頻率,將第一輸入頻率大于等于第一預設頻率的第一詞匯作為所述熱詞。
4.如權利要求2所述的詞庫管理方法,其特征在于,所述基于所述熱詞,挖掘出與所述熱詞相關的聯想詞,包括:
統計全網用戶或預設群體用戶在所述熱詞之后輸入的第二詞匯,以及每個第二詞匯對應的第二輸入頻率,將第二輸入頻率大于等于第二預設頻率的第二詞匯作為所述熱詞相關的聯想詞;或
將所述熱詞作為搜索關鍵詞,利用搜索引擎進行搜索,獲得與所述熱詞對應的熱點事件相關的文章,在所述文章的文章標題或文章正文中確定出所述熱詞相關的聯想詞。
5.如權利要求1~4任一所述的詞庫管理方法,其特征在于,所述將所述熱詞、以及所述聯想詞添加到預設詞庫中之后,還包括:
判斷所述熱詞是否在有效期內;
若否,則對所述熱詞、以及所述聯想詞進行失效處理。
6.如權利要求5所述的詞庫管理方法,其特征在于,所述判斷所述熱詞是否在有效期內,包括:
獲取全網用戶或預設群體用戶近期輸入所述熱詞的第三輸入頻率;
判斷所述第三輸入頻率是否大于等于第三預設頻率;
若是,則所述熱詞在所述有效期內;
否則,所述熱詞不在所述有效期內。
7.如權利要求5所述的詞庫管理方法,其特征在于,所述對所述熱詞、以及所述聯想詞進行失效處理,包括:
將所述熱詞、以及所述聯想詞從所述預設詞庫中刪除。
8.一種詞庫管理裝置,其特征在于,包括:
獲得單元,用于基于第一用戶已輸入的內容,獲得至少一個熱詞,以及與所述熱詞相關的聯想詞;
添加單元,用于將所述熱詞、以及所述聯想詞添加到預設詞庫中,以使得在第二用戶輸入所述熱詞時,能夠從所述預設詞庫中提取所述聯想詞,并將所述聯想詞作為所述熱詞的候選詞。
9.一種詞庫管理裝置,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,其特征在于,所述處理器執行所述程序時實現以下步驟:
基于第一用戶已輸入的內容,獲得至少一個熱詞,以及與所述熱詞相關的聯想詞;將所述熱詞、以及所述聯想詞添加到預設詞庫中,以使得在第二用戶輸入所述熱詞時,能夠從所述預設詞庫中提取所述聯想詞,并將所述聯想詞作為所述熱詞的候選詞。
10.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,該程序被處理器執行時實現以下步驟:
基于第一用戶已輸入的內容,獲得至少一個熱詞,以及與所述熱詞相關的聯想詞;將所述熱詞、以及所述聯想詞添加到預設詞庫中,以使得在第二用戶輸入所述熱詞時,能夠從所述預設詞庫中提取所述聯想詞,并將所述聯想詞作為所述熱詞的候選詞。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京搜狗科技發展有限公司,未經北京搜狗科技發展有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810226154.0/1.html,轉載請聲明來源鉆瓜專利網。





