[發明專利]用戶群體的分類方法、裝置、存儲介質及計算機設備有效
| 申請號: | 202111412279.0 | 申請日: | 2021-11-25 |
| 公開(公告)號: | CN113836370B | 公開(公告)日: | 2022-03-01 |
| 發明(設計)人: | 陶景龍;王啟凡;魏國富;殷錢安;余賢喆;周曉勇;梁淑云;劉勝;馬影 | 申請(專利權)人: | 上海觀安信息技術股份有限公司 |
| 主分類號: | G06F16/9035 | 分類號: | G06F16/9035;G06F16/906;G06N20/00 |
| 代理公司: | 北京中強智尚知識產權代理有限公司 11448 | 代理人: | 黃耀威 |
| 地址: | 200000 上海市浦東新*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用戶 群體 分類 方法 裝置 存儲 介質 計算機 設備 | ||
本發明公開了一種用戶群體的分類方法、裝置、存儲介質及計算機設備。其中方法包括:獲取用戶群體的行為數據,并對用戶群體的行為數據進行預處理,得到以每個用戶的用戶名為主體對象的行為序列數據集;利用關聯分析算法,對行為序列數據集中的頻繁行為指令組合進行提取和頻次統計,得到頻繁指令組合特征表;通過序列對比算法,計算行為序列數據集中的各個行為序列之間的序列匹配分值和序列間相似度分值,得到序列相似性特征表;對行為序列數據集中的行為指令進行頻次統計,得到行為指令頻次特征表;采用半監督分類算法,對頻繁指令組合特征表、序列相似性特征表和行為指令頻次特征表進行分類分析,得到具有不同類別的用戶群體,以提高分類效率。
技術領域
本發明涉及大數據處理技術領域,尤其是涉及一種用戶群體的分類方法、裝置、存儲介質及計算機設備。
背景技術
用戶群體分類是在以用戶為運營載體的各行各業發展過程中尤為重要的一個環節,在面對如電商、公共資源管理、信息安全管理等擁有巨大用戶群體的平臺時,如何做到將獨立的用戶對象進行群體分類,是一件十分困難且重要的工作。相較于傳統的依據用戶屬性構造特征進行群體分類的方法,將用戶的操作行為當作原始特征進行用戶群體劃分的方法顯然更為創新和有效,并且,按照用戶操作行為對用戶群體進行劃分之后,在將其分類數據應用到下游工作中時,也更能發揮出精準推薦、拉新留存、群體管理等各項優勢來。
在現有技術中,基于用戶操作行為的群體分類方法大多是根據用戶操作行為的基本屬性、用戶行為軌跡和用戶社交聯系等屬性作為特征,結合業務邏輯為數據集添加標簽,并使用有監督機器學習算法對用戶群體進行分類。但是,這種用戶群體的分類方法無法適用于用戶之間無社交關系和用戶操作無行為軌跡的應用場景中,并且,為用戶群體添加標簽也是一項人力成本非常高且效率十分低下的工作。因此,上述用戶群體的分類方法看似非常有效,實則應用場景十分受限,且所需的人力成本高昂,模型訓練效率十分低下。
發明內容
有鑒于此,本申請提供了一種用戶群體的分類方法、裝置、存儲介質及計算機設備,主要目的在于解決現有技術中用戶群體的分類方法應用場景受限、所需人力成本高昂和模型訓練效率低下的技術問題。
根據本發明的第一個方面,提供了一種用戶群體的分類方法,該方法包括:
獲取用戶群體的行為數據,并對用戶群體的行為數據進行預處理,得到以每個用戶的用戶名為主體對象的行為序列數據集,其中,每個用戶名對應一個行為序列,每個行為序列包含至少一個行為指令;
利用關聯分析算法,對行為序列數據集中的頻繁行為指令組合進行提取和頻次統計,得到頻繁指令組合特征表;
通過序列對比算法,計算行為序列數據集中的各個行為序列之間的序列匹配分值和序列間相似度分值,得到序列相似性特征表;
對行為序列數據集中的行為指令進行頻次統計,得到行為指令頻次特征表;
采用半監督分類算法,對頻繁指令組合特征表、序列相似性特征表和行為指令頻次特征表進行分類分析,得到具有不同類別的用戶群體。
根據本發明的第二個方面,提供了一種用戶群體的分類裝置,該裝置包括:
用戶數據獲取模塊,用于獲取用戶群體的行為數據,并對用戶群體的行為數據進行預處理,得到以每個用戶的用戶名為主體對象的行為序列數據集,其中,每個用戶名對應一個行為序列,每個行為序列包含至少一個行為指令;
頻繁項特征提取模塊,用于利用關聯分析算法,對行為序列數據集中的頻繁行為指令組合進行提取和頻次統計,得到頻繁指令組合特征表;
相似性特征提取模塊,用于通過序列對比算法,計算行為序列數據集中的各個行為序列之間的序列匹配分值和序列間相似度分值,得到序列相似性特征表;
指令頻次特征提取模塊,用于對行為序列數據集中的行為指令進行頻次統計,得到行為指令頻次特征表;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海觀安信息技術股份有限公司,未經上海觀安信息技術股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111412279.0/2.html,轉載請聲明來源鉆瓜專利網。





