[發明專利]一種熱詞統計方法、系統、電子設備和存儲介質在審
| 申請號: | 202110486427.7 | 申請日: | 2021-04-30 |
| 公開(公告)號: | CN113051893A | 公開(公告)日: | 2021-06-29 |
| 發明(設計)人: | 宋雨;丁銳;宗宇;程璐 | 申請(專利權)人: | 中國銀行股份有限公司 |
| 主分類號: | G06F40/216 | 分類號: | G06F40/216;G06F40/289 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 陳穎 |
| 地址: | 100818 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 統計 方法 系統 電子設備 存儲 介質 | ||
本發明公開了一種熱詞統計方法、系統、電子設備和存儲介質,獲取預設時間段內的客戶語料,對客戶語料按照預設處理規則進行處理得到待選詞集合,統計待選詞集合中每個待選詞出現的次數,得到每個待選詞的詞頻,基于每個待選詞的詞頻,從待選詞集合中篩選出熱詞集合,熱詞集合中每個熱詞的詞頻高于待選詞集合中非熱詞的詞頻,對熱詞集合中的各個熱詞按照不同的詞頻分布規律進行統計得到不同類型的熱詞子集合。本發明在從客戶語料中篩選出熱詞集合后,根據熱詞集合中的各個熱詞按照不同的詞頻分布規律,對熱詞集合做了進一步劃分,得到不同類型的熱詞子集合,從而可以滿足不同運營角色的需求。
技術領域
本發明涉及熱詞識別技術領域,更具體的說,涉及一種熱詞統計方法、系統、電子設備和存儲介質。
背景技術
呼叫中心是銀行與客戶的聯絡中心,通過在呼叫中心運營系統實時統計客戶語料,從客戶語料中統計出熱門詞匯(簡稱熱詞),可以有助于銀行確定用戶需求,從而有針對性的解決客戶的問題,提高客戶體驗。
現有技術中針對客戶語料中提取的熱詞采用的是相同的統計方法,然而在實際應用中,不同的運營角色所關注的熱詞不同,因此,現有的熱詞統計方法無法滿足不同運營角色的需求。
發明內容
有鑒于此,本發明公開一種熱詞統計方法、系統、電子設備和存儲介質,以實現進行熱詞統計時,滿足不同運營角色的需求。
一種熱詞統計方法,包括:
獲取預設時間段內的客戶語料;
對所述客戶語料按照預設處理規則進行處理,得到待選詞集合;
統計所述待選詞集合中每個待選詞出現的次數,得到每個所述待選詞的詞頻;
基于每個所述待選詞的詞頻,從所述待選詞集合中篩選出熱詞集合,所述熱詞集合中每個熱詞的詞頻高于所述待選詞集合中非熱詞的詞頻;
對所述熱詞集合中的各個熱詞按照不同的詞頻分布規律進行統計,得到不同類型的熱詞子集合。
可選的,所述對所述熱詞集合中的各個熱詞按照不同的詞頻分布規律進行統計,得到不同類型的熱詞子集合,具體包括:
將所述熱詞集合中在所述客戶語料中出現的次數一直穩定在預設區間內容中的熱詞,確定為長期熱詞;
對所述熱詞集合中所有的所述長期熱詞進行統計,得到長期熱詞子集合。
可選的,所述對所述熱詞集合中的各個熱詞按照不同的詞頻分布規律進行統計,得到不同類型的熱詞子集合,具體包括:
將所述熱詞集合按照時序劃分成多個統計區間;
將所述熱詞集合中在不同的所述統計區間中出現的次數為梯度分布,且梯度值大于梯度閾值的熱詞,確定為短期突發熱詞;
對所述熱詞集合中所有的所述短期突發熱詞進行統計,得到短期突發熱詞子集合。
可選的,所述對所述熱詞集合中的各個熱詞按照不同的詞頻分布規律進行統計,得到不同類型的熱詞子集合,具體包括:
將所述熱詞集合按照時序劃分成多個統計區間;
確定每個統計區間中的各個熱詞出現的次數;
將所述熱詞集合中在不同的所述統計區間中出現的次數成周期性分布的熱詞,確定為周期性熱詞;
對所述熱詞集合中所有的所述周期性熱詞進行統計,得到周期性熱詞子集合。
可選的,所述對所述客戶語料按照預設處理規則進行處理,得到待選詞集合,具體包括:
對所述客戶語料進行中文分詞和停用詞刪除,得到所述待選詞集合。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國銀行股份有限公司,未經中國銀行股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110486427.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種母乳源鼠李糖乳桿菌及其應用
- 下一篇:一種潤腸通便的壓片糖果及其制備方法





