[發明專利]一種基于MapReduce架構的大規模圖數據聚類算法在審
| 申請號: | 201510346735.4 | 申請日: | 2015-06-19 |
| 公開(公告)號: | CN104991912A | 公開(公告)日: | 2015-10-21 |
| 發明(設計)人: | 張海仙;章毅;王鈺 | 申請(專利權)人: | 四川大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 成都弘毅天承知識產權代理有限公司 51230 | 代理人: | 楊保剛;劉賢科 |
| 地址: | 610064 四*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 mapreduce 架構 大規模 數據 算法 | ||
1.一種基于MapReduce架構的大規模圖數據聚類算法,其特征在于,包括如下步驟:
①計算圖數據的鄰接矩陣A;
②計算圖的度對角矩陣D;
③計算傳遞因子;
④得到源節點傳遞一次信息后的高維表示;
⑤傳遞次數小于T時,返回第四步,否則結束并輸出結果。
2.根據權利要求1所述的基于MapReduce架構的大規模圖數據聚類算法,其特征在于,所述步驟②具體包括以下步驟:
a、作為無向圖數據的度對角矩陣,相當于每行對角元素代表此行標號節點的度數,這樣的話將度對角元素直接存入一維數組中方便后續計算。
b、map函數:計算圖的度對角矩陣類似一個計數的過程,map過程中的<key,value>的設定為:key為每行第一個節點的編號,value的值恒為1,map的過程是將每一組數據下放到每一個節點。
c、reduce函數:reduce過程是map結果的計數過程,即對map過程產生的<key,1>進行求和操作,對于同一個key值,產生一個<key,sum>的結果,每一個key的sum值即為key這個節點對應的度數。
3.根據權利要求1所述的基于MapReduce架構的大規模圖數據聚類算法,其特征在于,所述步驟③具體包括以下步驟:
a、對于無向圖的鄰接矩陣,理解為除了節點編號對應下標的值為1之外其他全為0即對于一行的圖數據[23,56]來說,表示其鄰接矩陣值A23,56=1;
b、map函數:對于計算T矩陣的map函數來說,map過程中的<key,value>設定為:A矩陣的橫向下標和縱向下標,輸出表示若橫向下標和縱向下標一一對應地存在,說明此處A矩陣的值為1。
c、reduce函數:在計算T矩陣的過程中,從數組中取出對角矩陣元素值,先用“result.set(value++x)”的方法將縱坐標和結果值連起來,最后再輸出“context.write(key,result);”即輸出值為T矩陣非零元素的橫向下標,縱向下標以及此坐標所對應的矩陣值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于四川大學,未經四川大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201510346735.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種目標信息獲取、推送方法及裝置
- 下一篇:一種目標物品的識別處理方法及裝置





