[發明專利]一種面向知識圖譜的大規模數據增量處理方法在審
| 申請號: | 202010189883.0 | 申請日: | 2020-03-18 |
| 公開(公告)號: | CN111382320A | 公開(公告)日: | 2020-07-07 |
| 發明(設計)人: | 劉穎;朱連宏;關禮安;白新有;張巍;張洋銘;陳劍;羅承昆 | 申請(專利權)人: | 軍事科學院系統工程研究院系統總體研究所 |
| 主分類號: | G06F16/901 | 分類號: | G06F16/901 |
| 代理公司: | 中國航天科工集團公司專利中心 11024 | 代理人: | 張國虹 |
| 地址: | 100101 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 面向 知識 圖譜 大規模 數據 增量 處理 方法 | ||
1.一種面向知識圖譜的大規模數據增量處理方法,其特征在于,包括如下步驟:
(10)利用圖分割算法將初始的加權圖分割成多個子圖;
(20)獲取時間片周期中的圖的增量序列;
(30)按照各個子圖負載均衡的原則把圖的增量序列映射成點和邊的插入、刪除操作,以及邊的權值更新操作;
(40)計算子圖相互之間的緊密度矩陣;
(50)如果子圖之間的緊密度大于子圖內部的緊密度,則動態調整節點與子圖的隸屬關系,直至子圖相互之間滿足內部高內聚,外部低耦合的要求。
2.根據權利要求1要求所述的面向知識圖譜的大規模數據增量處理方法,其特征在于,所述(10)步驟為:
將初始加權圖G分割成n個子圖,G={G1,G2,...,Gi,...,Gj,…,Gn},其中Gi代表第i個子圖,其中Gi包括分量Gi(Vi,Ei,Wi),其中Vi表示子圖i的節點集合;Ei表示子圖i的邊的集合;Wi表示子圖i的邊權值信息的集合,其中Gj包括分量Gj(Vj,Ej,Wj),同理Gj代表第j個子圖,其中Vj表示子圖j的節點集合;Ej表示子圖j的邊的集合;Wj表示子圖j的邊權值信息的集合。
3.根據權利要求2要求所述的面向知識圖譜的大規模數據增量處理方法,其特征在于,所述(30)步驟為:
給定一個圖G={G1,G2,...,Gi,...,Gj,…,Gn},對其進行的變化操作GCO通過一個二元組op,value的形式表示,其中op=ins/del/upd,分別表示插入/刪除/權值更改;value表示對應插入/刪除/權值更改的節點或邊的信息;相關操作如下:
邊的插入:value表示為(u,v,w),u,v為圖G的節點,w為邊(u,v)的權;
節點的插入:新節點u的插入以通過一組邊的形式表示,value表示為一組邊的集合{(u,v1,w1),(u,v2,w2),(u,v3,w3)…};
邊的刪除:value以(u,v)的形式表示;
節點u的刪除:value表示為u_id,要刪除節點u的編號;
邊權值的更改:value表示為(u,v,wnew),wnew則表示為邊(u,v)更新后的權值;
(31)一個時間片T內圖變化操作集合GCOS由一系列的圖變化操作GCOt組成,t表示時間戳,GCOS表示為:GCOST={GCO1,GCO2,...,GCOt,...};
(32)按照時間戳依次分析時間戳在前的圖變化操作與其后的圖變化操作是否相關,將相關的操作元組進行合并,減少圖變化操作集合中操作元組的個數;
(33)在合并后的GCOST中每次取出時間戳最小的操作元組,按照元組的說明對圖進行變化操作,所述變化操作包括插入邊、插入新節點、刪除邊、刪除節點、更改邊的權值,直到GCOST為空。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于軍事科學院系統工程研究院系統總體研究所,未經軍事科學院系統工程研究院系統總體研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010189883.0/1.html,轉載請聲明來源鉆瓜專利網。





