[發(fā)明專利]一種基于博弈論的增量式異構(gòu)圖聚類方法有效
| 申請?zhí)枺?/td> | 201810271526.1 | 申請日: | 2018-03-29 |
| 公開(公告)號: | CN108399268B | 公開(公告)日: | 2022-04-29 |
| 發(fā)明(設(shè)計)人: | 高云君;陳璐;浦世亮;張遠亮 | 申請(專利權(quán))人: | 浙江大學(xué);杭州海康威視數(shù)字技術(shù)股份有限公司 |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35 |
| 代理公司: | 杭州求是專利事務(wù)所有限公司 33200 | 代理人: | 邱啟旺 |
| 地址: | 310058 浙江*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 博弈論 增量 構(gòu)圖 方法 | ||
本發(fā)明公開了一種基于博弈論的增量式異構(gòu)圖聚類方法。本發(fā)明利用Personalized Pagerank作為統(tǒng)一的距離度量方式;利用增量式計算提高Personalized Pagerank得分的計算效率;基于DBSCAN算法并且利用博弈論的方法對聚類結(jié)果進行調(diào)整;利用熵以及邊權(quán)重更新的方式來平衡結(jié)構(gòu)信息和屬性信息之間的重要性。本方法使用Personalized Pagerank來度量圖結(jié)構(gòu)中任意兩個結(jié)點之間的相似性,利用增量式計算方式計算結(jié)點之間的Personalized Pagerank得分;采用DBSCAN算法得到初步的聚類結(jié)果并根據(jù)博弈論來對聚類結(jié)果進行調(diào)整;根據(jù)聚類結(jié)果計算熵,更新不同類型的邊的權(quán)重。本發(fā)明同時考慮異構(gòu)圖結(jié)點的結(jié)構(gòu)相似性和屬性相似性,提高了Personalized Pagerank得分的計算效率并對聚類結(jié)果進行優(yōu)化,提出了一種效率高,聚類質(zhì)量好的異構(gòu)圖聚類方法。
技術(shù)領(lǐng)域
本發(fā)明涉及異構(gòu)圖上的聚類技術(shù),特別涉及一種基于博弈論的增量式異構(gòu)圖聚類方法。
背景技術(shù)
隨著社交媒體和移動互聯(lián)網(wǎng)的發(fā)展,現(xiàn)實生活中存在著大量的具有不同類型并且相互關(guān)聯(lián)的對象的集合,可以通過一個異構(gòu)圖模型來表示,例如DBLP和Flickr。通過對異構(gòu)圖中的對象結(jié)點進行聚類,可以將彼此相似并且聯(lián)系緊密的對象劃分到一起,可廣泛應(yīng)用于社區(qū)檢測和推薦系統(tǒng)等領(lǐng)域。異構(gòu)圖上的聚類算法一直以來都是數(shù)據(jù)庫、數(shù)據(jù)挖掘和機器學(xué)習(xí)領(lǐng)域的研究熱點。
目前主流的異構(gòu)圖聚類算法往往只考慮了異構(gòu)圖中的屬性特征或者結(jié)構(gòu)特征,因此丟失了大量的有用的信息;某些方法雖然同時考慮了異構(gòu)圖的屬性信息和結(jié)構(gòu)信息,但其方法需要進行大量的矩陣運算,并且計算過程需要將數(shù)據(jù)全部放在內(nèi)存中處理,因此存在巨大的時間開銷和存儲開銷,也制約了方法的擴展性。此外,傳統(tǒng)的聚類算法常存在對部分對象聚類效果欠佳的情況,有必要對聚類后的結(jié)果再進行優(yōu)化,以提高整體的聚類質(zhì)量。所以,設(shè)計一種高效,拓展性強,能同時考慮異構(gòu)圖結(jié)構(gòu)和屬性信息,并且能夠?qū)垲惤Y(jié)果進行更深層次優(yōu)化的異構(gòu)圖聚類算法為了學(xué)術(shù)界與工業(yè)界的迫切需求。
發(fā)明內(nèi)容
針對上述不足,本發(fā)明提供一種基于博弈論的增量式異構(gòu)圖聚類方法。該方法在構(gòu)建完DBLP的異構(gòu)圖模型后,采用Personalized Pagerank增量計算的方式計算任意兩個論文結(jié)點之間的Personalized Pagerank得分,基于傳統(tǒng)的DBSCAN算法進行聚類,并且利用博弈論方法對聚類結(jié)果進行調(diào)整,然后迭代進行邊權(quán)重更新直至收斂,完成聚類,得到所有的論文結(jié)點的聚類結(jié)果。
為了達到上述目的,本發(fā)明所采用技術(shù)方案如下:一種基于博弈論的增量式異構(gòu)圖聚類方法,該方法包括如下步驟:
步驟(1):對DBLP數(shù)據(jù)集進行預(yù)處理,構(gòu)建異構(gòu)圖模型;
步驟(2):對異構(gòu)圖模型中的每一個論文結(jié)點,基于Personalized Pagerank算法進行回退時,只處理主類結(jié)點,即論文結(jié)點,然后將所有結(jié)點的殘留值和儲存值保存在外存中,用于步驟(3)的更新使用;
步驟(3):根據(jù)當(dāng)前邊的權(quán)重,對異構(gòu)圖模型中的每一個論文結(jié)點,重新計算轉(zhuǎn)移概率矩陣,讀取步驟(2)保存的殘留值和儲存值,對所有結(jié)點進行回退操作,計算出每個論文結(jié)點到圖結(jié)構(gòu)中其他論文結(jié)點的Personalized Pagerank得分;
步驟(4):對任意兩個論文結(jié)點之間的兩個Personalized Pagerank得分,取兩者之間的較小值作為兩個結(jié)點的相似性度量;
步驟(5):基于DBSCAN算法對所有論文結(jié)點進行聚類;
步驟(6):基于博弈論對步驟(5)的聚類結(jié)果進行調(diào)整,得到新的聚類結(jié)果;
步驟(7):基于步驟(6)獲得的新的聚類結(jié)果的信息熵對論文與其他屬性結(jié)點之間的邊權(quán)重進行更新,如果當(dāng)前邊權(quán)重和上一輪邊權(quán)重的均方誤差小于設(shè)定的誤差限,則得到最終聚類結(jié)果,否則返回步驟(3)重復(fù)迭代計算。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江大學(xué);杭州海康威視數(shù)字技術(shù)股份有限公司,未經(jīng)浙江大學(xué);杭州海康威視數(shù)字技術(shù)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810271526.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 一種基于博弈論的MIMO信道跟蹤方法
- 一種基于終端制式差異的異構(gòu)網(wǎng)負載分配方法
- 基于博弈論的微網(wǎng)負荷控制方法
- 一種基于博弈論的南水北調(diào)水資源調(diào)度方法
- 一種基于博弈論的車聯(lián)網(wǎng)RSU最優(yōu)配置方法
- 一種融合目標外觀模型和博弈論的視頻目標互遮擋處理方法
- 一種基于滿意博弈論的飛行器沖突解脫方法及裝置
- 一種基于博弈論的網(wǎng)絡(luò)攻擊風(fēng)險控制方法及系統(tǒng)
- 基于貝葉斯博弈和聲譽評分的網(wǎng)絡(luò)惡意用戶防御方法
- 基于博弈論的區(qū)塊鏈通證激勵裝置、方法、介質(zhì)及終端
- 自動構(gòu)圖支持裝置及方法
- 數(shù)字圖像處理裝置中提供構(gòu)圖信息的方法和設(shè)備
- 系統(tǒng)設(shè)計裝置
- 輔助影像拍攝的構(gòu)圖裝置及數(shù)碼相機
- 一種移動終端圖片查看方法及系統(tǒng)
- 卷紙構(gòu)圖
- 照片拍攝的構(gòu)圖方法、構(gòu)圖裝置及計算機可讀存儲介質(zhì)
- 輔助拍攝方法、終端設(shè)備及計算機可讀存儲介質(zhì)
- 一種異構(gòu)圖卷積網(wǎng)絡(luò)的訓(xùn)練方法、裝置、設(shè)備和介質(zhì)
- 構(gòu)圖方法,構(gòu)圖裝置,構(gòu)圖模板及構(gòu)圖模板制造方法





