[發明專利]周期詞挖掘方法、系統、電子設備及可讀存儲介質在審
| 申請號: | 201810738295.0 | 申請日: | 2018-07-06 |
| 公開(公告)號: | CN110688846A | 公開(公告)日: | 2020-01-14 |
| 發明(設計)人: | 鄺秋鴻;邵榮防;郝暉;歐陽碩;謝群群;劉儒君 | 申請(專利權)人: | 北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司 |
| 主分類號: | G06F40/284 | 分類號: | G06F40/284;G06Q30/06 |
| 代理公司: | 31283 上海弼興律師事務所 | 代理人: | 薛琦;羅朗 |
| 地址: | 100195 北京市海淀區杏石口路6*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 檢索關鍵詞 周期特征 預設 檢索 預設時間段 檢索數據 特征標簽 標簽庫 時間段 相似度 挖掘 標簽 可讀存儲介質 電子設備 方法使用 用戶習慣 存儲 檢測 靈活 | ||
本發明公開了一種周期詞挖掘方法、系統、電子設備及可讀存儲介質,周期詞挖掘方法包括:獲取一預設時間段內所有用戶的檢索數據,檢索數據包括多個檢索關鍵詞和每個關鍵詞的檢索時間;對每個檢索關鍵詞檢測檢索關鍵詞是否具有熱搜時間段,檢索關鍵詞在熱搜時間段內的檢索次數達到在預設時間段內的檢索總次數的預設百分比;若包含,生成檢索關鍵詞的特征標簽;預設一周期特征標簽庫,周期特征標簽庫存儲有多個周期特征標簽;計算特征標簽與每個周期特征標簽的相似度;判斷計算得到的最高相似度是否高于一預設閾值,若高于,則確認檢索關鍵詞為周期詞。本發明的周期詞挖掘方法使用靈活,數據成本低,符合用戶習慣,且有較高的準確性。
技術領域
本發明屬于信息處理技術領域,尤其涉及一種周期詞挖掘方法、系統、電子設備及可讀存儲介質。
背景技術
周期詞是指在搜索引擎中用戶隨著季節、時令變化而搜索量周期性變化的周期詞。電商行業中的周期詞可以被用于用戶需求監測,指導運營、采銷人員根據用戶在周期中的需求進行文案運營、采購等操作;也可以對外展示,吸引更多有類似需求的用戶購買這些周期熱點商品。
周期詞的挖掘中,一般使用過去幾年的用戶搜索行為歷史數據變化情況作為是否是周期詞的依據,但在某些情況下往年數據缺失,數據不足兩個或兩個以上周期時,現有的挖掘算法會失效,完全無法從數據中挖掘出周期屬性。
發明內容
本發明要解決的技術問題是為了克服現有技術中缺失往年數據時無法有效挖掘周期屬性的缺陷,提供一種周期詞挖掘方法、系統、電子設備及可讀存儲介質。
本發明是通過下述技術方案來解決上述技術問題:
一種周期詞挖掘方法,所述周期詞挖掘方法包括:
獲取一預設時間段內所有用戶的檢索數據,所述檢索數據包括多個檢索關鍵詞和每個所述關鍵詞的檢索時間;
對每個所述檢索關鍵詞檢測所述檢索關鍵詞是否具有熱搜時間段,所述檢索關鍵詞在所述熱搜時間段內的檢索次數達到在所述預設時間段內的檢索總次數的預設百分比;
若包含,生成所述檢索關鍵詞的特征標簽,所述特征標簽用于表征所述檢索關鍵詞對應的熱搜時間段;
預設一周期特征標簽庫,所述周期特征標簽庫存儲有多個周期特征標簽,不同的周期特征標簽用于表征不同的熱搜周期;
計算所述特征標簽與每個所述周期特征標簽的相似度;
判斷計算得到的最高相似度是否高于一預設閾值,若高于,則確認所述檢索關鍵詞為周期詞。
較佳地,所述檢測所述檢索關鍵詞是否包含熱搜時間段的步驟之前,所述周期詞挖掘方法還包括:
將所述預設時間段劃分為多個單位時段,并統計每個所述單位時段內所述檢索關鍵詞的單位檢索次數;
所述檢測所述檢索關鍵詞是否包含熱搜時間段的步驟具體包括:
按照次數大小依次將排序靠前的若干單位時段的單位檢索次數累加,直至累加檢索次數達到在所述預設時間段內的檢索總次數的預設百分比;
判斷所述若干單位時段是否為連續時間段。
較佳地,所述統計每個所述單位時段內所述檢索關鍵詞的單位檢索次數的步驟之后,所述周期詞挖掘方法還包括:
任意選取一目標單位時段;
判斷所述目標單位時段的單位檢索次數是否大于與所述目標單位時段相鄰的兩個單位時段的單位檢索次數之和的2倍或小于所述相鄰的兩個單位時段的單位檢索次數之差的1/2倍;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司,未經北京京東尚科信息技術有限公司;北京京東世紀貿易有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810738295.0/2.html,轉載請聲明來源鉆瓜專利網。





