[發明專利]節點分析方法、裝置、設備及存儲介質有效
| 申請號: | 202011499271.8 | 申請日: | 2020-12-17 |
| 公開(公告)號: | CN112612832B | 公開(公告)日: | 2023-02-10 |
| 發明(設計)人: | 李艷紅;馮宇波;張俊杰;毛勇崗 | 申請(專利權)人: | 北京銳安科技有限公司 |
| 主分類號: | G06F16/25 | 分類號: | G06F16/25;G06F16/901 |
| 代理公司: | 北京品源專利代理有限公司 11332 | 代理人: | 孟金喆 |
| 地址: | 100044 北京市海淀區西小口*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 節點 分析 方法 裝置 設備 存儲 介質 | ||
本發明公開了一種節點分析方法、裝置、設備及存儲介質中,所述節點分析方法包括:獲取圖數據庫的節點信息和邊信息,基于節點信息和邊信息確定與節點關聯的邊,針對每個節點,統計與節點關聯的邊數量,在與節點關聯的邊數量大于預設閾值時,確定節點是超級節點。本實施例中,通過節點和邊的關聯關系,確定每個節點擁有的邊數量,進而根據邊數量確定超級節點,不需要對圖數據庫中的每個節點進行遍歷,提高查找超級節點的效率,減少節點查找對圖數據庫正常服務時的壓力。
技術領域
本發明實施例涉及數據庫技術領域,尤其涉及節點分析方法、裝置、設備及存儲介質。
背景技術
圖數據庫是NoSQL數據庫的一種類型,它應用圖形理論存儲實體之間的關系信息。最常見的例子,就是社會網絡中人與人之間的關系。例如JanusGraph是一個可擴展的圖數據庫,可以把包含數千億個節點和邊的圖存儲在多機集群上,使用模塊化接口來做數據持久化、索引和客戶端訪問。Apache HBase是它支持的一種典型后端存儲系統。
圖數據庫中一般存在一些超級節點,超級節點是指擁有的邊數對整個網絡的邊數占比很高的節點。圖數據庫對與上述超級節點有關的增刪改操作效率很差,查詢過程中遇到超級節點也會使查詢結果爆炸導致圖遍歷不能繼續進行,因此識別出圖數據庫中的超級節點是非常有必要的。
在數據量非常大時,采用傳統的圖遍歷方式來發現超級節點不僅效率較低,也會對圖數據庫正常服務產生較大的壓力,甚至無法計算并得到全部超級節點。
發明內容
本發明實施例提供了節點分析方法、裝置、設備及存儲介質,提高查找超級節點的效率,減少節點查找對圖數據庫正常服務時的壓力。
第一方面,本發明實施例提供了一種節點分析方法,包括:
獲取圖數據庫的節點信息和邊信息;
基于所述節點信息和所述邊信息確定與節點關聯的邊;
針對每個節點,統計與節點關聯的邊數量,
在所述與節點關聯的邊數量大于預設閾值時,確定所述節點是超級節點。
進一步的,獲取圖數據庫的節點信息和邊信息,包括:
加載所述圖數據庫的元數據文件;
讀取并解析所述圖數據庫的原始記錄;
從所述原始記錄中獲取圖數據庫的節點信息和邊信息。
進一步的,統計與節點關聯的邊數量,包括:
統計與所述節點關聯的邊的總數量;
相應的,在所述與節點關聯的邊數量大于預設閾值時,確定所述節點是超級節點,包括:在所述與節點關聯的邊總數量大于第一預設閾值時,確定所述節點是超級節點。
進一步的,統計與節點關聯的邊數量,包括:獲取與所述節點關聯的邊類型;統計所述邊類型分別對應的邊數量;
相應的,在所述與節點關聯的邊數量大于預設閾值時,確定所述節點是超級節點,包括:
在任意一個所述邊類型對應的邊數量超過該邊類型對應的第二預設閾值時,確定所述節點標識對應的節點是超級節點。
進一步的,獲取圖數據庫的節點標識和邊標識之前,還包括:
加載所述圖數據庫的配置信息;
通過所述配置信息初始化所述圖數庫管理接口;
通過所述圖數庫管理接口連接所述所述圖數庫。
其中,所述配置信息包括:所述圖數據庫后端存儲系統主機名、端口號、表名稱和所述預設閾值。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京銳安科技有限公司,未經北京銳安科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011499271.8/2.html,轉載請聲明來源鉆瓜專利網。





