[發(fā)明專利]一種圖數(shù)據(jù)集成計算方法在審
| 申請?zhí)枺?/td> | 202310598648.2 | 申請日: | 2023-05-25 |
| 公開(公告)號: | CN116595485A | 公開(公告)日: | 2023-08-15 |
| 發(fā)明(設計)人: | 袁軼慧;徐彥武;倪偉淵;錢吟霄;王子清;王申 | 申請(專利權)人: | 江蘇省聯(lián)合征信有限公司 |
| 主分類號: | G06F18/25 | 分類號: | G06F18/25;G06F18/2113;G06F21/62;G06F16/901 |
| 代理公司: | 南京智造力知識產(chǎn)權代理有限公司 32382 | 代理人: | 戴羽豐 |
| 地址: | 210019 江蘇省*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 數(shù)據(jù) 集成 計算方法 | ||
本發(fā)明提供了一種圖數(shù)據(jù)集成計算方法,首先服務器根據(jù)請求從各圖數(shù)據(jù)節(jié)點中獲取包含頭實體的頭關聯(lián)子圖和包含尾實體的尾關聯(lián)子圖;接著以頭實體至尾實體關聯(lián)路徑最短為要求,將各個頭關聯(lián)子圖與尾關聯(lián)子圖進行兩兩融合,得到若干融合子圖;最后比較各融合子圖中頭實體至尾實體的最短關聯(lián)路徑的長度,找出其中長度最小的融合子圖,將該融合子圖作為查詢結果輸出。本發(fā)明通過只提取包含頭實體和尾實體的部分圖譜數(shù)據(jù),減少了融合時的數(shù)據(jù)量與計算量;并且在計算最短路徑時,先做一次初步篩選,盡可能地減少連接計算量,提升計算效率。另一方面,參與計算的數(shù)據(jù)量減少,也能有效減少信息泄露的可能性和危害。
技術領域
本發(fā)明屬于機器學習技術領域,具體涉及一種圖數(shù)據(jù)集成計算方法。
背景技術
大數(shù)據(jù)分析是信息時代的關鍵技術之一,數(shù)據(jù)的全面性、完整性則是影響大數(shù)據(jù)分析技術充分發(fā)揮性能的關鍵所在。各個數(shù)據(jù)的擁有者或管理者都會建立自己的圖數(shù)據(jù)庫,各個圖數(shù)據(jù)庫中可能存儲有所需數(shù)據(jù)的某一個或多個維度的信息,但鮮有某個擁有者或管理者能夠完整掌握所需的全部維度信息。因而,將分散各方的信息關聯(lián)起來十分重要。通過不同數(shù)據(jù)源的信息關聯(lián),才能建立完整的信息鏈,進而做到較為準確詳實的數(shù)據(jù)分析。
例如數(shù)據(jù)源A擁有本地所有企業(yè)的股東與實際控制人信息圖譜,數(shù)據(jù)源B擁有本地企業(yè)的財務信息及風險關聯(lián)圖譜。對于通過多層控股實際控制了甲、乙、丙三家企業(yè)的某自然人X而言,數(shù)據(jù)源A知曉X有對甲、乙、丙三價企業(yè)的實際控制權,但缺少相關財務信息、風險信息;數(shù)據(jù)源B知曉甲、乙、丙三家企業(yè)的實際財務和風險信息,但不知道背后的實際控制人信息。在做對X所控企業(yè)的風險預警分析時,就必須結合關聯(lián)數(shù)據(jù)源A和B的信息。
現(xiàn)有技術中有通過第三方服務器來統(tǒng)籌連接各參與方的圖數(shù)據(jù)庫,形成一套電子信息查詢系統(tǒng),其中各參與方的圖數(shù)據(jù)庫構成系統(tǒng)中的一個圖數(shù)據(jù)節(jié)點。各個圖數(shù)據(jù)節(jié)點基于各自的圖譜結構信息和圖神經(jīng)網(wǎng)絡模型來生成知識向量,而后將各知識向量統(tǒng)一送至第三方服務器進行融合。現(xiàn)有技術在對多維度數(shù)據(jù)圖譜進行融合的迭代過程中,計算效率仍有較大的可提升空間;另一方面,各方數(shù)據(jù)提交第三方服務器時缺少ID加密,存在泄露實體身份的風險,尤其是當服務器匯集多個來源的實體信息時,這種風險及可能帶來的損失會被成倍放大。
發(fā)明內(nèi)容
針對現(xiàn)有技術中存在的不足,本發(fā)明提供了一種圖數(shù)據(jù)集成計算方法,用以優(yōu)化多維度數(shù)據(jù)圖譜融合時的計算效率,并解決信息泄露方面的問題。
本發(fā)明通過以下技術手段實現(xiàn)上述技術目的。
一種圖數(shù)據(jù)集成計算方法,其特征在于:應用于由服務器和若干圖數(shù)據(jù)節(jié)點組成的電子信息系統(tǒng),包括以下步驟:
步驟一,服務器根據(jù)請求從各圖數(shù)據(jù)節(jié)點中獲取包含頭實體的頭關聯(lián)子圖和包含尾實體的尾關聯(lián)子圖;
步驟二,以頭實體至尾實體關聯(lián)路徑最短為要求,將各個頭關聯(lián)子圖與尾關聯(lián)子圖進行兩兩融合,得到若干融合子圖;
步驟三,比較各融合子圖中頭實體至尾實體的最短關聯(lián)路徑的長度,找出其中長度最小的融合子圖,將該融合子圖作為查詢結果輸出。
進一步地,步驟二中,頭關聯(lián)子圖與尾關聯(lián)子按以下步驟進行融合:
計算頭關聯(lián)子圖與尾關聯(lián)子圖中各對信息實體間的連接概率,將其中連接概率最大的一對信息實體作為初始的候選組合,其余各對信息實體作為對比組合;
將所述候選組合建立信息關聯(lián),計算其中頭實體至尾實體的最短關聯(lián)路徑長度,所述長度記為候選路徑長度;
按照連接概率降序,依次將各對比組合與候選組合進行比較,其中比較過程為:
第一步,先計算對比組合中頭實體至其關聯(lián)實體的最短關聯(lián)路徑長度、尾實體至其關聯(lián)實體的最短關聯(lián)路徑長度,判斷這兩個長度是否均小于候選路徑長度:
否的話,則淘汰此對比組合;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江蘇省聯(lián)合征信有限公司,未經(jīng)江蘇省聯(lián)合征信有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202310598648.2/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結構
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





