[發明專利]一種熱詞統計方法、系統、電子設備和存儲介質在審
| 申請號: | 202110486427.7 | 申請日: | 2021-04-30 |
| 公開(公告)號: | CN113051893A | 公開(公告)日: | 2021-06-29 |
| 發明(設計)人: | 宋雨;丁銳;宗宇;程璐 | 申請(專利權)人: | 中國銀行股份有限公司 |
| 主分類號: | G06F40/216 | 分類號: | G06F40/216;G06F40/289 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 陳穎 |
| 地址: | 100818 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 統計 方法 系統 電子設備 存儲 介質 | ||
1.一種熱詞統計方法,其特征在于,包括:
獲取預設時間段內的客戶語料;
對所述客戶語料按照預設處理規則進行處理,得到待選詞集合;
統計所述待選詞集合中每個待選詞出現的次數,得到每個所述待選詞的詞頻;
基于每個所述待選詞的詞頻,從所述待選詞集合中篩選出熱詞集合,所述熱詞集合中每個熱詞的詞頻高于所述待選詞集合中非熱詞的詞頻;
對所述熱詞集合中的各個熱詞按照不同的詞頻分布規律進行統計,得到不同類型的熱詞子集合。
2.根據權利要求1所述的熱詞統計方法,其特征在于,所述對所述熱詞集合中的各個熱詞按照不同的詞頻分布規律進行統計,得到不同類型的熱詞子集合,具體包括:
將所述熱詞集合中在所述客戶語料中出現的次數一直穩定在預設區間內容中的熱詞,確定為長期熱詞;
對所述熱詞集合中所有的所述長期熱詞進行統計,得到長期熱詞子集合。
3.根據權利要求1所述的熱詞統計方法,其特征在于,所述對所述熱詞集合中的各個熱詞按照不同的詞頻分布規律進行統計,得到不同類型的熱詞子集合,具體包括:
將所述熱詞集合按照時序劃分成多個統計區間;
將所述熱詞集合中在不同的所述統計區間中出現的次數為梯度分布,且梯度值大于梯度閾值的熱詞,確定為短期突發熱詞;
對所述熱詞集合中所有的所述短期突發熱詞進行統計,得到短期突發熱詞子集合。
4.根據權利要求1所述的熱詞統計方法,其特征在于,所述對所述熱詞集合中的各個熱詞按照不同的詞頻分布規律進行統計,得到不同類型的熱詞子集合,具體包括:
將所述熱詞集合按照時序劃分成多個統計區間;
確定每個統計區間中的各個熱詞出現的次數;
將所述熱詞集合中在不同的所述統計區間中出現的次數成周期性分布的熱詞,確定為周期性熱詞;
對所述熱詞集合中所有的所述周期性熱詞進行統計,得到周期性熱詞子集合。
5.根據權利要求1所述的熱詞統計方法,其特征在于,所述對所述客戶語料按照預設處理規則進行處理,得到待選詞集合,具體包括:
對所述客戶語料進行中文分詞和停用詞刪除,得到所述待選詞集合。
6.一種熱詞統計系統,其特征在于,包括:
獲取單元,用于獲取預設時間段內的客戶語料;
處理單元,用于對所述客戶語料按照預設處理規則進行處理,得到待選詞集合;
詞頻統計單元,用于統計所述待選詞集合中每個待選詞出現的次數,得到每個所述待選詞的詞頻;
篩選單元,用于基于每個所述待選詞的詞頻,從所述待選詞集合中篩選出熱詞集合,所述熱詞集合中每個熱詞的詞頻高于所述待選詞集合中非熱詞的詞頻;
熱詞子集合統計單元,用于對所述熱詞集合中的各個熱詞按照不同的詞頻分布規律進行統計,得到不同類型的熱詞子集合。
7.根據權利要求6所述的熱詞統計系統,其特征在于,所述熱詞子集合統計單元具體包括:
長期熱詞確定子單元,用于將所述熱詞集合中在所述客戶語料中出現的次數一直穩定在預設區間內容中的熱詞,確定為長期熱詞;
第一集合統計子單元,用于對所述熱詞集合中所有的所述長期熱詞進行統計,得到長期熱詞子集合。
8.根據權利要求6所述的熱詞統計系統,其特征在于,所述熱詞子集合統計單元具體包括:
第一劃分子單元,用于將所述熱詞集合按照時序劃分成多個統計區間;
短期突發熱詞確定子單元,用于將所述熱詞集合中在不同的所述統計區間中出現的次數為梯度分布,且梯度值大于梯度閾值的熱詞,確定為短期突發熱詞;
第二集合統計子單元,用于對所述熱詞集合中所有的所述短期突發熱詞進行統計,得到短期突發熱詞子集合。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國銀行股份有限公司,未經中國銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110486427.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種母乳源鼠李糖乳桿菌及其應用
- 下一篇:一種潤腸通便的壓片糖果及其制備方法





