[發明專利]基于稀疏矩陣的知識圖譜查詢方法、裝置和計算機設備有效
| 申請號: | 202010123647.9 | 申請日: | 2020-02-27 |
| 公開(公告)號: | CN111368027B | 公開(公告)日: | 2022-09-09 |
| 發明(設計)人: | 李肯立;肖國慶;陳玥丹;唐卓;陽王東;周旭 | 申請(專利權)人: | 湖南大學 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/36 |
| 代理公司: | 華進聯合專利商標代理有限公司 44224 | 代理人: | 劉羚 |
| 地址: | 410001 湖*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 稀疏 矩陣 知識 圖譜 查詢 方法 裝置 計算機 設備 | ||
本申請涉及一種基于稀疏矩陣的知識圖譜查詢方法、裝置、計算機設備和存儲介質。所述方法包括:獲取知識圖譜并將所述知識圖譜轉換成稀疏矩陣;基于所述稀疏矩陣中各行向量的行向量長度,分別對所述稀疏矩陣進行行向量劃分,得到各劃分稀疏矩陣;分別評估各所述劃分稀疏矩陣的行向量長度的離散度,確定離散度最低的劃分稀疏矩陣;根據計算核的對齊字節對離散度最低的所述劃分稀疏矩陣進行行向量填充,得到填充稀疏矩陣;基于所述填充稀疏矩陣進行所述知識圖譜的查詢。采用本方法能夠提高查詢效率。
技術領域
本申請涉及圖查詢領域,特別是涉及一種基于稀疏矩陣的知識圖譜查詢方 法、裝置、計算機設備和存儲介質。
背景技術
知識圖譜也被稱為科學知識圖譜,在圖書情報界稱為知識域可視化或知識 領域映射地圖,是顯示知識發展進程與結構關系的一系列各種不同的圖形,用 可視化技術描述知識資源及其載體,挖掘、分析、構建、繪制和顯示知識及它 們之間的相互聯系。知識圖譜數據管理的一個重要問題是如何對知識圖譜的數 據進行存儲和查詢,大部分知識圖譜的數據使用資源描述框架(Resource Description Framework,RDF)數據集來表示。其中,RDF三元組是構成RDF圖 的最基本單元。
隨著知識圖譜相關技術的不斷發展,RDF三元組數據日益激增,并且被廣 泛地應用在多個領域,包括科學、生物信息、商業智能和社交網絡等。在現實 世界中,RDF數據集往往達到數億條三元組數據。因此,目前如何有效管理大 規模RDF圖數據集受到越來越多的關注。同時,隨著稀疏矩陣數據結構和算法 的發展,以及事實上RDF數據的稀疏性無處不在,促使了許多研究人員采用稀 疏矩陣運算來解決圖計算的問題。具體到RDF圖,通過將RDF圖存儲為一個稀 疏矩陣,對RDF圖的查詢操作也隨之可以轉換為一系列簡明的稀疏矩陣運算。
然而,由于RDF圖的稀疏性并沒有得到解決,轉換成稀疏矩陣之后稀疏矩 陣中非零元的分布同樣具有稀疏、分布不規律的特點,使得利用該稀疏矩陣進 行查詢時容易造成較長的響應時間,從而導致降低了查詢效率。
發明內容
基于此,有必要針對上述技術問題,提供一種能夠提高查詢效率的基于稀 疏矩陣的知識圖譜查詢方法、裝置、計算機設備和存儲介質。
一種基于稀疏矩陣的知識圖譜查詢方法,所述方法包括:
獲取知識圖譜并將所述知識圖譜轉換成稀疏矩陣;
基于所述稀疏矩陣中各行向量的行向量長度,分別對所述稀疏矩陣進行行 向量劃分,得到各劃分稀疏矩陣;
分別評估各所述劃分稀疏矩陣的行向量長度的離散度,確定離散度最低的 劃分稀疏矩陣;
根據計算核的對齊字節對離散度最低的所述劃分稀疏矩陣進行行向量填 充,得到填充稀疏矩陣;
基于所述填充稀疏矩陣進行所述知識圖譜的查詢。
在其中一個實施例中,所述基于所述稀疏矩陣中各行向量的行向量長度, 分別對所述稀疏矩陣進行行向量劃分,得到各劃分稀疏矩陣,包括:
確定所述稀疏矩陣中行向量長度最長的行向量的長度值;
獲取小于所述長度值的各個正整數組成劃分閾值集合;
依次將所述劃分閾值集合中的所述正整數作為劃分閾值,從所述稀疏矩陣 中確定行向量長度大于所述劃分閾值的行向量;
基于所述劃分閾值,將確定的行向量長度大于所述劃分閾值的各行向量分 別劃分成多個行向量長度不大于所述劃分閾值的子行向量,得到所述劃分閾值 對應的劃分稀疏矩陣。
在其中一個實施例中,所述分別評估各所述劃分稀疏矩陣的行向量長度的 離散度,得到離散度最低的劃分稀疏矩陣,包括:
分別確定各所述劃分稀疏矩陣的行向量長度的標準差;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于湖南大學,未經湖南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010123647.9/2.html,轉載請聲明來源鉆瓜專利網。





