[發(fā)明專利]一種網(wǎng)絡(luò)行為聚類方法及裝置在審
| 申請?zhí)枺?/td> | 201710667905.8 | 申請日: | 2017-08-07 |
| 公開(公告)號: | CN107491513A | 公開(公告)日: | 2017-12-19 |
| 發(fā)明(設(shè)計)人: | 李子華 | 申請(專利權(quán))人: | 安徽優(yōu)易思信息技術(shù)有限責任公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 230088 安徽省合肥市高新區(qū)黃*** | 國省代碼: | 安徽;34 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 網(wǎng)絡(luò) 行為 方法 裝置 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及網(wǎng)絡(luò)行為聚類技術(shù)領(lǐng)域,特別涉及一種網(wǎng)絡(luò)行為聚類方法及裝置。
背景技術(shù)
現(xiàn)有技術(shù)通常采用層次聚類的聚類方法為聚類間的通信選擇合適的目標聚類,最初形成的聚類可以被稱為初始聚類,在初始聚類的基礎(chǔ)上,選取聚類中具有代表性的對等體測量聚類間的網(wǎng)絡(luò)距離,將網(wǎng)絡(luò)距離較近的初始聚類組成一個更高層次的聚類。
在形成更高層次的聚類時,通常使用全球網(wǎng)絡(luò)定位(GNP,Global Network Positioning)坐標方式測量對等體之間的網(wǎng)絡(luò)距離,首先在網(wǎng)絡(luò)中選取K個對等體作為目標對等體,之后每個對等體測量它到這K個目標對等體的往返時間(RTT,Real Time Time)得到每個對等體到這K個目標對等體之間的網(wǎng)絡(luò)距離,得到一個K維的坐標稱GNP坐標,計算不同初始聚類中對等體間的網(wǎng)絡(luò)距離作為初始聚類間的距離,將網(wǎng)絡(luò)距離小于某個范圍的初始聚類組成一個新的更高層次的聚類,在進行初始聚類間的通信時,就可以優(yōu)先利用這些網(wǎng)絡(luò)距離較近的初始聚類,每個對等體在需要與外部聚類進行通信時,可以從這個高級聚類中選擇初始聚類,優(yōu)先使用這些網(wǎng)絡(luò)距離較近的初始聚類,與這些初始聚類內(nèi)的對等體建立連接,顯然可以更有效的利用網(wǎng)絡(luò)資源。
在對現(xiàn)有技術(shù)的研究和實踐過程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術(shù)存在以下問題:
由于層次聚類的聚類方法為確定性聚類,在形成新的更高層次的聚類后的網(wǎng)絡(luò)狀況將不再被考慮,而在實際運行中,由于初始聚類之間的對等體通信比初始聚類內(nèi)的對等體通信,需要經(jīng)過更長的傳輸網(wǎng)絡(luò)路徑,在這么長的傳輸路徑上,其實際可用帶寬很容易受到網(wǎng)絡(luò)運行狀況的影響而變得不穩(wěn)定,也就是說使用層次聚類的聚類方法確定的網(wǎng)絡(luò)距離反映的是對等體間某一時間點的可用帶寬,不能反映網(wǎng)絡(luò)可用帶寬的動態(tài)變化特性,相應(yīng)采用這個網(wǎng)絡(luò)距離來為初始聚類間的通信選擇合適的目標聚類,在初始聚類間的網(wǎng)絡(luò)帶寬發(fā)生動態(tài)變化時,將不能根據(jù)這些變化選擇較優(yōu)的目標聚類。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題是提供一種網(wǎng)絡(luò)行為聚類方法及裝置,旨在提高對用戶的網(wǎng)絡(luò)行為的聚類結(jié)果的準確率。
為實現(xiàn)上述目的,本發(fā)明提供以下的技術(shù)方案:一種網(wǎng)絡(luò)行為聚類方法,其特征在于,所述方法包括步驟:
根據(jù)預(yù)設(shè)規(guī)則,搜集目標用戶的網(wǎng)絡(luò)行為數(shù)據(jù);
從所述網(wǎng)絡(luò)行為數(shù)據(jù)中提取任意一個目標用戶網(wǎng)絡(luò)行為數(shù)據(jù)的特征信息;
根據(jù)所述特征信息,獲取所述網(wǎng)絡(luò)行為中任一個網(wǎng)絡(luò)行為與其它網(wǎng)絡(luò)行為的關(guān)聯(lián)關(guān)系,其中,所述關(guān)聯(lián)關(guān)系為:基于預(yù)設(shè)關(guān)鍵詞,判斷任意至少兩個具有相同所述預(yù)設(shè)關(guān)鍵詞的網(wǎng)絡(luò)行為具有關(guān)聯(lián)關(guān)系;
根據(jù)所述關(guān)聯(lián)關(guān)系,對所述網(wǎng)絡(luò)行為進行聚類。
可選的,所述方法還包括步驟:
確定用戶所在的地理位置,并根據(jù)地理位置設(shè)置地理位置信息權(quán)重;
根據(jù)所述地理位置信息權(quán)重,計算聚類結(jié)果中每一類結(jié)果的等級值;
將計算出的等級值按照預(yù)先設(shè)置的排列順序進行排序。
可選的,所述根據(jù)預(yù)設(shè)規(guī)則,搜集目標用戶的網(wǎng)絡(luò)行為數(shù)據(jù)的步驟,包括:
通過服務(wù)器日志分析系統(tǒng)、網(wǎng)絡(luò)用戶活動日志系統(tǒng)集、地理信息系統(tǒng)或第三方數(shù)據(jù)接口中的至少一種,搜集目標用戶的網(wǎng)絡(luò)行為數(shù)據(jù)。
可選的,所述網(wǎng)絡(luò)行為數(shù)據(jù)包括:
網(wǎng)絡(luò)購買數(shù)據(jù)和/或網(wǎng)絡(luò)評價數(shù)據(jù)。
可選的,所述從所述網(wǎng)絡(luò)行為數(shù)據(jù)中提取任意一個目標用戶網(wǎng)絡(luò)行為數(shù)據(jù)的步驟,包括:
采用文檔詞頻的技術(shù),從所述網(wǎng)絡(luò)行為數(shù)據(jù)中提取任意一個目標用戶網(wǎng)絡(luò)行為數(shù)據(jù)。
另外,本發(fā)明實施例還提供了一種網(wǎng)絡(luò)行為聚類裝置,所述裝置包括:
搜集模塊,用于根據(jù)預(yù)設(shè)規(guī)則,搜集目標用戶的網(wǎng)絡(luò)行為數(shù)據(jù);
提取模塊,用于從所述網(wǎng)絡(luò)行為數(shù)據(jù)中提取任意一個目標用戶網(wǎng)絡(luò)行為數(shù)據(jù)的特征信息;
獲取模塊,用于根據(jù)所述特征信息,獲取所述網(wǎng)絡(luò)行為中任一個網(wǎng)絡(luò)行為與其它網(wǎng)絡(luò)行為的關(guān)聯(lián)關(guān)系,其中,所述關(guān)聯(lián)關(guān)系為:基于預(yù)設(shè)關(guān)鍵詞,判斷任意至少兩個具有相同所述預(yù)設(shè)關(guān)鍵詞的網(wǎng)絡(luò)行為具有關(guān)聯(lián)關(guān)系;
聚類模塊,用于根據(jù)所述關(guān)聯(lián)關(guān)系,對所述網(wǎng)絡(luò)行為進行聚類。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于安徽優(yōu)易思信息技術(shù)有限責任公司,未經(jīng)安徽優(yōu)易思信息技術(shù)有限責任公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710667905.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 網(wǎng)絡(luò)和網(wǎng)絡(luò)終端
- 網(wǎng)絡(luò)DNA
- 網(wǎng)絡(luò)地址自適應(yīng)系統(tǒng)和方法及應(yīng)用系統(tǒng)和方法
- 網(wǎng)絡(luò)系統(tǒng)及網(wǎng)絡(luò)至網(wǎng)絡(luò)橋接器
- 一種電力線網(wǎng)絡(luò)中根節(jié)點網(wǎng)絡(luò)協(xié)調(diào)方法和系統(tǒng)
- 一種多網(wǎng)絡(luò)定位方法、存儲介質(zhì)及移動終端
- 網(wǎng)絡(luò)裝置、網(wǎng)絡(luò)系統(tǒng)、網(wǎng)絡(luò)方法以及網(wǎng)絡(luò)程序
- 從重復(fù)網(wǎng)絡(luò)地址自動恢復(fù)的方法、網(wǎng)絡(luò)設(shè)備及其存儲介質(zhì)
- 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練方法、裝置及存儲介質(zhì)
- 網(wǎng)絡(luò)管理方法和裝置





