[發明專利]聚類分析方法、裝置、設備及存儲介質在審
| 申請號: | 202010883445.4 | 申請日: | 2020-08-28 |
| 公開(公告)號: | CN112035663A | 公開(公告)日: | 2020-12-04 |
| 發明(設計)人: | 岳小芬 | 申請(專利權)人: | 京東數字科技控股股份有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35 |
| 代理公司: | 北京同立鈞成知識產權代理有限公司 11205 | 代理人: | 朱穎;劉芳 |
| 地址: | 100176 北京市北京經濟*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 聚類分析 方法 裝置 設備 存儲 介質 | ||
本申請實施例提供一種聚類分析方法、裝置、設備及存儲介質,基于預先配置的聚類模型,分別獲取目標系統在第一時刻時的第一對象集的第一聚類結果、目標系統在第二時刻時的第二對象集的第二聚類結果,根據第一聚類結果和第二聚類結果,確定第二聚類結果相對于第一聚類結果的純度信息,最后根據上述純度信息,確定是否需要更新聚類模型。該技術方案中,通過將第二聚類結果相對于第一聚類結果的純度信息作為判斷指標,其能夠確定出合適的模型重訓練時機,不僅能夠避免用戶聚類不準確的問題,而且可以避免人力和時間浪費的問題,提高了策略實施效果。
技術領域
本申請實施例涉及自然語言處理技術領域,尤其涉及一種聚類分析方法、裝置、設備及存儲介質。
背景技術
聚類是將一群物理對象或者抽象對象劃分成相似的對象類的過程,這個相似的對象類通常叫做類或類簇。在實際應用中,企業為了提高業務轉化、促進交易,需要根據不同的用戶群體制定不同的策略方案,因而,如何對用戶進行聚類是實現策略處理的前提。
目前,用戶聚類方法主要是基于聚類模型對用戶進行聚類,該聚類模型的建立需要大量的人群標注數據,人群標注數據是專業人員通過對一定時期內的用戶行為進行分析得到的,但不同時期的用戶行為數據可能會發生較大變化,需要重新對用戶行為進行分析進而重新訓練得到聚類模型,又由于人群標注的工作量比較大,成本高,所以,現有技術中通常選擇一個固定時間間隔定期訓練聚類模型,以保證低訓練成本和模型的適用性。
然而,在實現本發明過程中,發明人發現上述方案至少存在如下問題:現有技術中的固定時間間隔是研究人員根據聚類模型的歷史更新時間設定的,其僅能表征歷史一段時間段內模型更新的時間間隔,無法準確表征正在使用的聚類模型能夠在未來一段時間內適用,當該聚類模型無法適用時,可能存在策略方案與人群分類不匹配的問題,也可能存在由于該聚類模型在未來一段時間內適用,但重復訓練導致人力和時間等資源浪費的問題。
例如,在到達預設的固定時間間隔之前,若用戶行為數據變化異常且已經遠遠超出之前的結果,但是模型研究人員不知道,由于還沒有到達模型重訓練的時間點,這時電子設備仍使用原有聚類模型進行聚類,會出現人群等對象分類錯誤的問題,進而導致策略和用戶不匹配,從而導致策略實施效果差的問題;再比如,在到達預設的固定時間間隔,若用戶行為數據變化較小,且模型運行穩健,但由于到了模型重訓練的時間點,模型研究人員還是會重新去分析模型結果,重新訓練模型,這時重新訓練的聚類模型與原有聚類模型差距較小,會存在人力和時間等資源浪費的問題。
綜上可知,現有的聚類模型分析方法均會存在由于聚類模型的訓練時機不準確,導致對象分類錯誤,進而致使不同對象集對應的策略方案實施效果差,或者,導致不需要的模型重訓練,進而存在的人力和時間等資源浪費的問題。
發明內容
本申請實施例提供一種聚類分析方法、裝置、設備及存儲介質,用以解決現有聚類模型的訓練時機不合適,導致對象分類錯誤或資源浪費的問題。
第一方面,本申請實施例提供一種聚類分析方法,包括:
基于預先配置的聚類模型,分別獲取第一對象集的第一聚類結果、第二對象集的第二聚類結果,所述第一對象集是目標系統在第一時刻的目標對象集,所述第二對象集是所述目標系統在第二時刻的目標對象集;
根據所述第一聚類結果和所述第二聚類結果,確定所述第二聚類結果相對于所述第一聚類結果的純度信息,所述純度信息用于指示所述第一對象集和所述第二對象集的對象聚類變化信息;
根據所述純度信息,確定是否需要更新所述聚類模型。
在第一方面的一種可能設計中,所述根據所述第一聚類結果和所述第二聚類結果,確定所述第二聚類結果相對于所述第一聚類結果的純度信息,包括:
根據所述第一聚類結果和所述第二聚類結果,確定所述第一對象集和所述第二對象集的對象聚類關聯信息;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于京東數字科技控股股份有限公司,未經京東數字科技控股股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010883445.4/2.html,轉載請聲明來源鉆瓜專利網。





