[發明專利]一種基于知識關聯的主題圖沖突檢測方法及系統有效
| 申請號: | 201810918417.4 | 申請日: | 2018-08-13 |
| 公開(公告)號: | CN109344293B | 公開(公告)日: | 2021-05-18 |
| 發明(設計)人: | 楊宗凱;杜旭;李浩;林炳;付一迪 | 申請(專利權)人: | 華中師范大學 |
| 主分類號: | G06F16/901 | 分類號: | G06F16/901;G06F16/907 |
| 代理公司: | 北京金智普華知識產權代理有限公司 11401 | 代理人: | 楊采良 |
| 地址: | 430079 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 知識 關聯 主題 沖突 檢測 方法 系統 | ||
1.一種基于知識關聯的主題圖沖突檢測方法,其特征在于,所述基于知識關聯的主題圖沖突檢測方法包括:
采用基于路徑和深度的知識元關聯關系的方法計算主題圖中知識元間的相關性;
計算主題圖中的知識元所關聯的資源組間的相關性,并結合知識元所關聯的資源描述信息進行計算知識元間的相似性;
利用基于路徑與深度的方式計算所得出的知識元之間的相關性與利用資源組多維描述信息標簽所構建詞向量計算得到的相關性,計算
基于路徑和深度的知識元關聯關系計算主題圖中知識元間的相關性中,
從信息理論的角度用公式表示結構中的主題圖公式
其中,表示的知識元k1與K2在主題圖中的共同性,diff(k1,k2)表示k1與k2在主題圖中的差異性;
和的計算公式如下
=γ+
=β+P(k1,k2)
其中,P(k1,k2)=Rk1+Rk2,表示知識元k1和k2之間的最短路徑,γ為深度調節參數,β為路徑調節參數,表示k1和k2的最近公共節點的深度;將公式=γ+、=β+P(k1,k2)帶入到公式中所得
;
計算主題圖中的知識元所關聯的資源組間的相關性,并結合知識元所關聯的資源描述信息進行計算知識元間的相似性,具體包括:
1)主題圖KG=把表征某知識元的組織單元中的名稱、描述標簽、描述內容進行分詞和詞性標注處理,并過濾掉停用詞,只保留指定詞性的單詞,構建一組描述知識元的詞組,此類詞組都是由名詞、動詞、形容詞組成,這些詞語已經存在,構成,其中表示的某個是由知識元和知識元所關聯的所有標簽信息表征的集合,其中是已經保留后的關鍵詞;
2)構建候選關鍵詞圖G=(V,E),其中V為節點集,由1中生成的候選關鍵詞組成,然后采用共現關系(co-occurrence)構造任兩點之間的邊,兩個節點之間存在邊僅當兩個節點對應的詞匯在長度為N的窗口中出現,N表示窗口大小,最多共現N個單詞;
3)根據TextRank算法迭代傳播各個節點的權重,直至收斂;TextRank算法為:
;
4)對節點權重進行倒敘排序,得到最重要的m個關鍵詞,作為表征關鍵詞;
通過提取表征知識元的關鍵詞摘要后所得到的關鍵詞集合;如果計算知識元與的相似性,則計算關鍵詞集合、的相似性;
單個關鍵詞表示的相似性
=。
2.如權利要求1所述的基于知識關聯的主題圖沖突檢測方法,其特征在于,
計算Rk與Rr的的偏差一致性,包括:
通過采用基于路徑和深度的方式計算知識元組間的相似性與采用基于知識元所關聯的資源組間的相似性兩種方法,結合知識元所關聯的資源描述信息,進行計算知識元間的相似性所計算得到的主題圖中知識元與知識元之間相似性,兩個知識元在主題圖中所處的結構中的相對位置偏差較大,按照主題圖構建的方式通過知識元和資源組表征所對比的相似性,得的最終兩種相似性比值趨于1附近的值;
Rk和Rr分別表示的是基于路徑與深度的方式計算所得出的知識元之間的相關性和計算主題圖中的知識元所關聯的資源組間的相關性;ψ表示的是整體偏差系數。
3.一種實現權利要求1~2任意一項所述基于知識關聯的主題圖沖突檢測方法的信息數據處理終端。
4.一種計算機可讀存儲介質,包括指令,當其在計算機上運行時,使得計算機執行如權利要求1-2任意一項所述的基于知識關聯的主題圖沖突檢測方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華中師范大學,未經華中師范大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810918417.4/1.html,轉載請聲明來源鉆瓜專利網。





