[發明專利]熱點關鍵詞的選取方法、設備和存儲介質在審
| 申請號: | 202010561415.1 | 申請日: | 2020-06-18 |
| 公開(公告)號: | CN111737555A | 公開(公告)日: | 2020-10-02 |
| 發明(設計)人: | 龔朝輝 | 申請(專利權)人: | 蘇州朗動網絡科技有限公司 |
| 主分類號: | G06F16/953 | 分類號: | G06F16/953;G06F16/33;G06F40/289 |
| 代理公司: | 蘇州威世朋知識產權代理事務所(普通合伙) 32235 | 代理人: | 董燕 |
| 地址: | 215000 江蘇省蘇州市*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 熱點 關鍵詞 選取 方法 設備 存儲 介質 | ||
1.一種熱點關鍵詞的選取方法,其特征在于,所述方法包括:
獲取一關鍵詞在多個預定周期內的變化速度的均值μ0和標準差S,所述關鍵詞的變化速度是指相鄰兩個預定周期內所述關鍵詞的標準化詞頻的差值;
獲取所述關鍵詞在最近的預定周期內的變化速度μ;
根據所述μ0、S和μ,計算所述關鍵詞的變化速度的Z檢驗的Z值:
根據所述Z值,判斷所述關鍵詞是否是熱點關鍵詞。
2.根據權利要求1所述熱點關鍵詞的選取方法,其特征在于,所述“獲取某個關鍵詞在預定周期內的變化速度的均值μ0和標準差S”具體包括:
獲取所述關鍵詞在多個預定周期內的多個變化速度,得到所述關鍵詞的變化速度集合;
根據所述變化速度集合,求所述關鍵詞的變化速度的均值μ0,并根據所述均值μ0,求所述關鍵詞的變化速度的標準差S。
3.根據權利要求2所述熱點關鍵詞的選取方法,其特征在于,所述方法還包括:
將所述關鍵詞在最近的預定周期內的變化速度μ加入所述變化速度集合,重新計算所述關鍵詞的變化速度的均值μ0和標準差S。
4.根據權利要求1所述熱點關鍵詞的選取方法,其特征在于,所述“根據所述Z值,判斷所述關鍵詞是否是熱點關鍵詞”具體包括:
若所述關鍵詞的Z值超過設定閾值,判定所述關鍵詞為熱點關鍵詞。
5.根據權利要求4所述熱點關鍵詞的選取方法,其特征在于,所述方法還包括:
每隔所述預定周期計算一次所述熱點關鍵詞的Z值,當發現所述Z值變為負值,則判定所述熱點關鍵詞對應的熱點新聞開始消退。
6.根據權利要求1所述熱點關鍵詞的選取方法,其特征在于,所述“根據所述Z值,判斷所述關鍵詞是否是熱點關鍵詞”具體包括:
若所述關鍵詞的Z值超過設定閾值,判斷所述關鍵詞對應的新聞是否為垃圾新聞,若是,刪除所述關鍵詞對應的新聞,若否,判定所述關鍵詞為熱點關鍵詞,所述關鍵詞對應的新聞為熱點新聞。
7.根據權利要求1所述熱點關鍵詞的選取方法,其特征在于,所述方法還包括:
每隔固定周期重新計算新聞中出現的所有關鍵詞;
分別計算每個關鍵詞在每個預定周期的變化速度的Z值,將每個關鍵詞的所有Z值存入數據庫中;
將每個預定周期內的每個關鍵詞的大小與Z值成正比的方式顯示在一起。
8.根據權利要求1所述熱點關鍵詞的選取方法,其特征在于:
所述關鍵詞在預定周期內的標準化詞頻,是指所述關鍵詞在預定周期內出現的次數除以預定周期內的新聞總量。
9.一種電子設備,包括存儲器和處理器,所述存儲器存儲有可在所述處理器上運行的計算機程序,其特征在于,所述處理器執行所述程序時實現權利要求1-8任意一項所述熱點關鍵詞的選取方法中的步驟。
10.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現權利要求1-8任意一項所述熱點關鍵詞的選取方法中的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州朗動網絡科技有限公司,未經蘇州朗動網絡科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010561415.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種可信芯片固件的融合系統、方法、裝置及設備
- 下一篇:一種自動去污的胸腔鏡





