[發(fā)明專利]基于移動應(yīng)用使用行為的用戶分群聚類方法有效
| 申請?zhí)枺?/td> | 201710756048.9 | 申請日: | 2017-08-29 |
| 公開(公告)號: | CN107704868B | 公開(公告)日: | 2020-06-16 |
| 發(fā)明(設(shè)計)人: | 馬創(chuàng);張令浩;徐光俠;劉俊;胡夢瀟 | 申請(專利權(quán))人: | 重慶郵電大學(xué) |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06Q30/02;G06Q50/30 |
| 代理公司: | 重慶市恒信知識產(chǎn)權(quán)代理有限公司 50102 | 代理人: | 李金蓉 |
| 地址: | 400065 重*** | 國省代碼: | 重慶;50 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 移動 應(yīng)用 使用 行為 用戶 群聚 方法 | ||
本發(fā)明提出一種基于移動應(yīng)用使用行為的用戶分群聚類方法,將SOM和Kmeans聚類算法相結(jié)合用于移動手機用戶分群。該方法首先構(gòu)建移動用戶移動應(yīng)用適用行為分析體系,將SOM和Kmeans方法相結(jié)合,對用戶的移動應(yīng)用上網(wǎng)行為進行分析,從而達(dá)到移動手機用戶分群的目的。使用SOM?Kmeans兩段式聚類分析,綜合了SOM算法計算簡單且包容性好和Kmeans算法對數(shù)據(jù)集數(shù)量要求不高的優(yōu)點,同時彌補SOM算法訓(xùn)練時間長,解決Kmeans算法初始值K難以確定的缺點。在以移動手機用戶使用偏好矩陣為分析數(shù)據(jù)的移動手機用戶聚類中,能在較短的時間內(nèi)得到比較好的細(xì)分結(jié)果。
技術(shù)領(lǐng)域
本發(fā)明涉及移動手機用戶上網(wǎng)行為挖掘領(lǐng)域,特別是涉及一種基于移動應(yīng) 用使用行為的用戶分群聚類方法。
背景技術(shù)
隨著互聯(lián)網(wǎng)的廣泛應(yīng)用,特別是移動互聯(lián)網(wǎng)、智能終端等的快速發(fā)展,人 們的生活也被越來越快的數(shù)字化。各類移動應(yīng)用手機的出現(xiàn),手機應(yīng)用越來越 被移動用戶所依賴,帶給人們溝通便利的同時,人們使用通信網(wǎng)絡(luò)傳輸?shù)臄?shù)據(jù) 量也出現(xiàn)爆炸式增。面對著當(dāng)前手機用戶的不斷增長和手機產(chǎn)生的大量數(shù)據(jù), 整個通信運營產(chǎn)業(yè)壓力突出,移動運營商面臨著數(shù)據(jù)流的附加值被互聯(lián)網(wǎng)公司 賺走的挑戰(zhàn)。客戶由于不同的興趣愛好而表現(xiàn)出不同的互聯(lián)網(wǎng)訪問行為,該訪 問行為里面蘊含著豐富的客戶信息,通過這些信息進行客戶內(nèi)容偏好分析,從 而更好地把握客戶需求,支撐和促進移動互聯(lián)網(wǎng)業(yè)務(wù)發(fā)展。因此基于內(nèi)容偏好 的移動互聯(lián)網(wǎng)上網(wǎng)行為已經(jīng)成為一個研究的熱點問題。如何利用好手中的大數(shù)據(jù),有效地分析出移動用戶的上網(wǎng)行為,有效地實施精確營銷,成為需要面對 的問題。
當(dāng)前,對移動用戶上網(wǎng)行為的分析大概有三大類:一類是基于用戶上網(wǎng)日 志和搜索關(guān)鍵字的挖掘,首先對用戶瀏覽過的頁面進行分詞,提取頁面關(guān)鍵字, 進一步分析用戶的上網(wǎng)偏好,形成用戶的上網(wǎng)偏好標(biāo)簽,得到用戶的畫像,進 一步對用戶進行Top-N的標(biāo)簽進行相關(guān)內(nèi)容推薦。另一類是基于形成的上網(wǎng)偏 好標(biāo)簽,使用神經(jīng)網(wǎng)絡(luò)或者馬克洛夫鏈等方法對用戶未來的上網(wǎng)行為進行預(yù)測。 還有一類是通過對用戶的上網(wǎng)套餐,流量等信息進行挖掘,進行用戶的業(yè)務(wù)套 餐規(guī)劃。
而針對移動用戶分群的研究,大多基于用戶的語音和短信信息分析,WAP 流量或瀏覽網(wǎng)頁的分析,沒有一種針對用戶移動應(yīng)用流量的分析方法。使用的 方法有兩種,一種使用Kmeans對用戶進行聚類,另一種則使用關(guān)聯(lián)分析的先關(guān) 分析,通過用戶之間的圖方法,得到相似的用戶。顯然面對數(shù)據(jù)量巨大的移動 應(yīng)用流量這些方法并不適用。
發(fā)明內(nèi)容
為克服上述問題中存在的缺陷,本發(fā)明的目的是提供一種基于移動應(yīng)用使 用行為的用戶分群聚類方法。該方法首先構(gòu)建移動用戶移動應(yīng)用適用行為分析 體系,將SOM和Kmeans方法相結(jié)合,對用戶的移動應(yīng)用上網(wǎng)行為進行分析, 從而達(dá)到移動手機用戶分群的目的。
為實現(xiàn)本發(fā)明的上述目的,本發(fā)明提出一種基于移動應(yīng)用使用行為的用戶 分群聚類方法,包括以下步驟:
S1:針對某一通信運行商,提取用戶特征信息、用戶應(yīng)用使用行為信息和 移動應(yīng)用信息,構(gòu)建移動手機用戶應(yīng)用使用行為分析體系。
S2:基于步驟S1所述移動手機用戶應(yīng)用使用行為分析體系,定義移動手機 用戶應(yīng)用使用偏好。
S3:根據(jù)步驟S2所述移動手機用戶應(yīng)用使用偏好的定義,構(gòu)建移動手機用 戶使用偏好矩陣P。
S4:將S3中構(gòu)建的移動手機用戶使用偏好矩陣P的行向量數(shù)據(jù)集E輸入至 SOM-Keams聚類算法中。
S5:使用SOM算法進行粗聚類,得到初步劃分的群數(shù)目n,并計算每個群 的群數(shù)據(jù)的平均值m;
S6:將所述群數(shù)目n賦給Kmeans算法的初始值k,挑選與每個群的群數(shù)據(jù) 平均值m接近的數(shù)據(jù)點作為中心點,使用Kmeans算法進行再次聚類,最終得 到用戶群的劃分結(jié)果,并輸出。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于重慶郵電大學(xué),未經(jīng)重慶郵電大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710756048.9/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 在線應(yīng)用平臺上應(yīng)用間通信的回調(diào)應(yīng)答方法、應(yīng)用及在線應(yīng)用平臺
- 應(yīng)用使用方法、應(yīng)用使用裝置及相應(yīng)的應(yīng)用終端
- 應(yīng)用管理設(shè)備、應(yīng)用管理系統(tǒng)、以及應(yīng)用管理方法
- 能力應(yīng)用系統(tǒng)及其能力應(yīng)用方法
- 應(yīng)用市場的應(yīng)用搜索方法、系統(tǒng)及應(yīng)用市場
- 使用應(yīng)用的方法和應(yīng)用平臺
- 應(yīng)用安裝方法和應(yīng)用安裝系統(tǒng)
- 使用遠(yuǎn)程應(yīng)用進行應(yīng)用安裝
- 應(yīng)用檢測方法及應(yīng)用檢測裝置
- 應(yīng)用調(diào)用方法、應(yīng)用發(fā)布方法及應(yīng)用發(fā)布系統(tǒng)





