[發明專利]一種基于知識圖譜中實體相似度的社區發現方法及裝置有效
| 申請號: | 201810498426.2 | 申請日: | 2018-05-23 |
| 公開(公告)號: | CN108959370B | 公開(公告)日: | 2021-04-06 |
| 發明(設計)人: | 王宏志;鄒開發;萬曉瓏;楊東華 | 申請(專利權)人: | 哈爾濱工業大學 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06Q50/00 |
| 代理公司: | 北京格允知識產權代理有限公司 11609 | 代理人: | 周嬌嬌;李亞東 |
| 地址: | 150001 黑龍*** | 國省代碼: | 黑龍江;23 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 知識 圖譜 實體 相似 社區 發現 方法 裝置 | ||
1.一種基于知識圖譜中實體相似度的社區發現方法,其特征在于,包括:
使用知識圖譜存儲社交網絡數據,并計算杰卡德距離得到相似度矩陣;
根據所述相似度矩陣計算所述知識圖譜中的相似節點集合;
根據所述相似節點集合進行迭代的標簽傳播,并根據迭代后的每個節點的標簽列表來確定該節點最終的社區標簽,以進行社區發現;
所述根據所述相似度矩陣計算知識圖譜中的相似節點集合,包括:
接收預設半徑和相似度閾值;
對于知識圖譜中的每個節點,搜索當前節點的預設半徑范圍內與所述當前節點相似度大于相似度閾值的節點,加入當前節點的相似節點集合;
所述根據所述相似節點集合進行迭代的標簽傳播,包括:
為知識圖譜中的每個節點初始化標簽列表,每個節點的標簽列表中初始化具有唯一的標簽,且權重為1;
設當前迭代次數的初始值為0,判斷當前迭代次數是否小于預設迭代次數,是則依次對所述知識圖譜中的每個節點進行標簽傳播操作,其中對于當前節點而言,以當前節點作為監聽者,并將當前節點的相似節點集合中的所有節點作為傳播者,將每個傳播者的標簽列表中權重最大的標簽以及權重發送給作為監聽者的當前節點;在知識圖譜中的每個節點均執行完該輪標簽傳播操作后,當前迭代次數加1,開始下一輪迭代,在當前迭代次數達到預設迭代次數時結束迭代;
所述根據迭代后的每個節點的標簽列表來確定該節點最終的社區標簽,包括:
對于知識圖譜中的所有節點,選取每個節點的標簽列表里權重最大的標簽作為其最終的社區標簽;
所述將每個傳播者的權重最大的標簽以及權重發送給作為監聽者的當前節點時,根據所述相似度矩陣計算傳播者與監聽者的相似度作為權重發送給監聽者。
2.一種基于知識圖譜中實體相似度的社區發現裝置,其特征在于,包括:圖譜存儲單元、相似集合單元和標簽傳播單元;
所述圖譜存儲單元,用于使用知識圖譜存儲社交網絡數據,并計算杰卡德距離得到相似度矩陣;
所述相似集合單元,用于根據所述相似度矩陣計算所述知識圖譜中的相似節點集合;
所述標簽傳播單元,用于根據所述相似節點集合進行迭代的標簽傳播,并根據迭代后的每個節點的標簽列表來確定該節點最終的社區標簽,以進行社區發現;
所述相似集合單元執行以下操作以根據所述相似度矩陣計算知識圖譜中的相似節點集合:
接收預設半徑和相似度閾值;
對于知識圖譜中的每個節點,搜索當前節點的預設半徑范圍內與所述當前節點相似度大于相似度閾值的節點,加入當前節點的相似節點集合;
所述標簽傳播單元執行以下操作以根據所述相似節點集合進行迭代的標簽傳播:
為知識圖譜中的每個節點初始化標簽列表,每個節點的標簽列表中初始化具有唯一的標簽,且權重為1;
設當前迭代次數的初始值為0,判斷當前迭代次數是否小于預設迭代次數,是則依次對所述知識圖譜中的每個節點進行標簽傳播操作,其中對于當前節點而言,以當前節點作為監聽者,并將當前節點的相似節點集合中的所有節點作為傳播者,將每個傳播者的標簽列表中權重最大的標簽以及權重發送給作為監聽者的當前節點;在知識圖譜中的每個節點均執行完該輪標簽傳播操作后,當前迭代次數加1,開始下一輪迭代,在當前迭代次數達到預設迭代次數時結束迭代;
所述標簽傳播單元對于知識圖譜中的所有節點,選取每個節點的標簽列表里權重最大的標簽作為其最終的社區標簽;
所述標簽傳播單元將每個傳播者的權重最大的標簽以及權重發送給作為監聽者的當前節點時,根據所述相似度矩陣計算傳播者與監聽者的相似度作為權重發送給監聽者。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱工業大學,未經哈爾濱工業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810498426.2/1.html,轉載請聲明來源鉆瓜專利網。





