[發(fā)明專利]熱詞統(tǒng)計方法及裝置、存儲介質(zhì)、電子終端在審
| 申請?zhí)枺?/td> | 201811567342.6 | 申請日: | 2018-12-20 |
| 公開(公告)號: | CN111353087A | 公開(公告)日: | 2020-06-30 |
| 發(fā)明(設(shè)計)人: | 胡曉 | 申請(專利權(quán))人: | 北京京東尚科信息技術(shù)有限公司;北京京東世紀貿(mào)易有限公司 |
| 主分類號: | G06F16/9535 | 分類號: | G06F16/9535;G06Q30/02 |
| 代理公司: | 北京律智知識產(chǎn)權(quán)代理有限公司 11438 | 代理人: | 袁禮君;闞梓瑄 |
| 地址: | 100086 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 統(tǒng)計 方法 裝置 存儲 介質(zhì) 電子 終端 | ||
1.一種熱詞統(tǒng)計方法,其特征在于,包括:
提取當前預(yù)設(shè)周期內(nèi)的會話數(shù)據(jù);
對所述會話數(shù)據(jù)進行預(yù)處理以獲取對應(yīng)的有效文本,并對所述有效文本進行統(tǒng)計以獲取對應(yīng)的計數(shù);
根據(jù)所述有效文本及對應(yīng)的計數(shù)更新有序排列的當前熱詞鏈表;其中,所述當前熱詞鏈表包括當前關(guān)鍵詞對象以及對應(yīng)的當前計數(shù)。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述對所述會話數(shù)據(jù)進行預(yù)處理以獲取有效文本包括:
對所述會話數(shù)據(jù)進行泛化處理、分詞處理,以獲取對應(yīng)的有效文本。
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述對所述會話數(shù)據(jù)進行泛化處理、分詞處理前,所述方法還包括:
利用預(yù)設(shè)關(guān)鍵詞黑名單對所述會話數(shù)據(jù)進行過濾處理。
4.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述有效文本包括至少一個關(guān)鍵詞,所述根據(jù)所述有效文本及對應(yīng)的計數(shù)更新有序排列的當前熱詞鏈表包括:
判斷所述當前熱詞鏈表中是否包括所述關(guān)鍵詞;
在判斷所述當前熱詞鏈表中包括所述關(guān)鍵詞時,根據(jù)所述關(guān)鍵詞的計數(shù)更新所述當前熱詞鏈表中所述當前關(guān)鍵詞對象的計數(shù);
根據(jù)所述當前關(guān)鍵詞對象更新后的計數(shù)更新其在熱詞鏈表中的排序位置。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述根據(jù)所述當前關(guān)鍵詞對象更新后的計數(shù)更新其在熱詞鏈表中的排序位置后,所述方法還包括:
根據(jù)所述當前關(guān)鍵詞對象更新前的所述當前計數(shù)以及更新后的計數(shù)統(tǒng)計該關(guān)鍵詞對象對應(yīng)的變化率。
6.根據(jù)權(quán)利要求4所述的方法,其特征在于,所述熱詞鏈表包括預(yù)設(shè)數(shù)量的關(guān)鍵詞對象,所述根據(jù)所述有效文本及對應(yīng)的計數(shù)更新有序排列的當前熱詞鏈表還包括:
若判斷所述當前熱詞鏈表中不包括所述關(guān)鍵詞,則讀取所述當前熱詞鏈表中的關(guān)鍵詞對象數(shù)量;
若所述當前熱詞鏈表中的關(guān)鍵詞對象數(shù)量小于預(yù)設(shè)數(shù)量,則將所述關(guān)鍵詞添加至所述當前熱詞鏈表,并依次與各所述當前關(guān)鍵詞對象對應(yīng)的當前計數(shù)進行對比,以確定所述關(guān)鍵詞在熱詞鏈表中的排序位置;或者
若所述當前熱詞鏈表包括預(yù)設(shè)數(shù)量的當前關(guān)鍵詞對象,則根據(jù)所述關(guān)鍵詞對應(yīng)的計數(shù)按倒序依次與各所述當前關(guān)鍵詞對象對應(yīng)的計數(shù)進行對比,以確定所述關(guān)鍵詞在所述當前熱詞鏈表中的排序位置。
7.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述當前熱詞鏈表包括多個類別的當前熱詞鏈表;
所述對所述有效文本進行統(tǒng)計以獲取對應(yīng)的計數(shù)后,所述方法還包括:
對所述有效文本按預(yù)設(shè)規(guī)則進行分類,以根據(jù)分類結(jié)果更新對應(yīng)類別的所述當前熱詞鏈表。
8.根據(jù)權(quán)利要求7所述的方法,其特征在于,所述方法還包括:
根據(jù)預(yù)設(shè)規(guī)則對更新后的熱詞鏈表中的關(guān)鍵詞對象進行過濾處理。
9.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述方法還包括:
對熱詞鏈表中的各關(guān)鍵詞對象進行語義識別,以合并語義相同的關(guān)鍵詞以及對應(yīng)的計數(shù);
根據(jù)合并后的所述關(guān)鍵詞對象對應(yīng)的計數(shù)進行排序。
10.一種熱詞統(tǒng)計裝置,其特征在于,包括:
會話數(shù)據(jù)提取模塊,用于提取當前預(yù)設(shè)周期內(nèi)的會話數(shù)據(jù);
有效文本統(tǒng)計模塊,用于對所述會話數(shù)據(jù)進行預(yù)處理以獲取對應(yīng)的有效文本,并對所述有效文本進行統(tǒng)計以獲取對應(yīng)的計數(shù);
熱詞統(tǒng)計模塊,用于根據(jù)所述有效文本及對應(yīng)的計數(shù)更新有序排列的當前熱詞鏈表;其中,所述當前熱詞鏈表包括當前關(guān)鍵詞對象以及對應(yīng)的當前計數(shù)。
11.一種存儲介質(zhì),其上存儲有計算機程序,所述程序被處理器執(zhí)行時實現(xiàn)根據(jù)權(quán)利要求1至9中任一項所述的熱詞統(tǒng)計方法。
12.一種電子終端,其特征在于,包括:
處理器;以及
存儲器,用于存儲所述處理器的可執(zhí)行指令;
其中,所述處理器配置為經(jīng)由執(zhí)行所述可執(zhí)行指令來執(zhí)行權(quán)利要求1至9中任一項所述的熱詞統(tǒng)計方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于北京京東尚科信息技術(shù)有限公司;北京京東世紀貿(mào)易有限公司,未經(jīng)北京京東尚科信息技術(shù)有限公司;北京京東世紀貿(mào)易有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811567342.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:中包車橫移裝置
- 下一篇:一種大容量儲液器的環(huán)路熱管組
- 統(tǒng)計系統(tǒng)、統(tǒng)計裝置和統(tǒng)計方法
- 人數(shù)統(tǒng)計方法和人數(shù)統(tǒng)計系統(tǒng)
- 統(tǒng)計物體數(shù)量的統(tǒng)計系統(tǒng)
- 網(wǎng)絡(luò)處理器的統(tǒng)計計數(shù)方法
- 統(tǒng)計信息上報方法及裝置
- 稿件統(tǒng)計方法和稿件統(tǒng)計系統(tǒng)
- 數(shù)據(jù)統(tǒng)計方法及裝置
- 獲取數(shù)據(jù)的統(tǒng)計狀態(tài)的方法及裝置
- 信息統(tǒng)計方法和信息統(tǒng)計裝置
- 電量統(tǒng)計系統(tǒng)及電量統(tǒng)計方法





