[發明專利]一種app用戶聚類方法及裝置有效
| 申請號: | 201610854321.7 | 申請日: | 2016-09-27 |
| 公開(公告)號: | CN107870934B | 公開(公告)日: | 2021-07-20 |
| 發明(設計)人: | 張路;潘宣辰 | 申請(專利權)人: | 武漢安天信息技術有限責任公司 |
| 主分類號: | G06F16/26 | 分類號: | G06F16/26 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 430000 湖北省武漢市東湖新技術*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 app 用戶 方法 裝置 | ||
1.一種app用戶聚類方法,其特征在于,所述app用戶聚類方法包括以下步驟:
獲取多個用戶的app列表,生成數據集,其中,所述數據集包括若干app名稱以及安裝有相應app的用戶ID;
按照預設的規則對所述數據集進行頻繁項集的挖掘,對所述數據集進行頻繁項集的挖掘時,安裝同一app的不同用戶構成一子項集;
根據挖掘的頻繁項集構建用戶關聯圖譜;
進行社區發現,將得到的用戶關聯圖譜劃分為若干區域;
其中,定義頻繁項集的方法如下:
其中I表示數據集中的所有用戶,X,Y分別為其中的兩個不同用戶,通過支持度Support(X,Y)來定義二者頻繁出現的程度,支持度越大,說明{X,Y}共同出現得越頻繁,反之越不頻繁;P(X,Y)表示數據集中{X,Y}共同出現的概率,num(X,Y)表示{X,Y}共同出現的次數,num(I)表示用戶總數。
2.如權利要求1所述的app用戶聚類方法,其特征在于,所述用戶關聯圖譜包括節點和邊,每一個用戶用一節點表示,構成頻繁項集的用戶之間通過邊連接。
3.如權利要求1所述的app用戶聚類方法,其特征在于,進行頻繁項集的挖掘的方法包括Apriori算法或FP-tree算法。
4.如權利要求1所述的app用戶聚類方法,其特征在于,進行社區發現的方法包括Modularity算法。
5.一種app用戶聚類裝置,其特征在于,所述聚類裝置包括數據采集模塊、數據挖掘模塊、關聯圖譜生成模塊、社區發現模塊,其中:
所述數據采集模塊用于獲取多個用戶的app列表,生成數據集,其中,所述數據集包括若干app名稱以及安裝有相應app的用戶ID;
所述數據挖掘模塊用于按照預設的規則對所述數據集進行頻繁項集的挖掘,所述數據挖掘模塊對所述數據集進行頻繁項集的挖掘時,安裝同一app的不同用戶構成一子項集;
所述關聯圖譜生成模塊用于根據挖掘的頻繁項集構建用戶關聯圖譜;
所述社區發現模塊用于進行社區發現,將得到的用戶關聯圖譜劃分為若干區域;
其中,定義頻繁項集的方法如下:
其中I表示數據集中的所有用戶,X,Y分別為其中的兩個不同用戶,通過支持度Support(X,Y)來定義二者頻繁出現的程度,支持度越大,說明{X,Y}共同出現得越頻繁,反之越不頻繁;P(X,Y)表示數據集中{X,Y}共同出現的概率,num(X,Y)表示{X,Y}共同出現的次數,num(I)表示用戶總數。
6.如權利要求5所述的app用戶聚類裝置,其特征在于,所述用戶關聯圖譜包括節點和邊,每一個用戶用一節點表示,構成頻繁項集的用戶之間通過邊連接。
7.如權利要求5所述的app用戶聚類裝置,其特征在于,所述數據挖掘模塊進行頻繁項集的挖掘的方法包括Apriori算法或FP-tree算法。
8.如權利要求5所述的app用戶聚類裝置,其特征在于,所述社區發現模塊進行社區發現的方法包括Modularity算法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢安天信息技術有限責任公司,未經武漢安天信息技術有限責任公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610854321.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:統計安卓應用頁面瀏覽行為的方法、裝置及系統
- 下一篇:一種搜索方法及裝置





