[發(fā)明專利]數(shù)據(jù)湖的知識圖譜生成方法及裝置在審
| 申請?zhí)枺?/td> | 202210120630.7 | 申請日: | 2022-02-09 |
| 公開(公告)號: | CN114462603A | 公開(公告)日: | 2022-05-10 |
| 發(fā)明(設(shè)計)人: | 李卓林 | 申請(專利權(quán))人: | 中國銀行股份有限公司 |
| 主分類號: | G06N5/02 | 分類號: | G06N5/02;G06K9/62 |
| 代理公司: | 北京三友知識產(chǎn)權(quán)代理有限公司 11127 | 代理人: | 楊丹;沈珍珠 |
| 地址: | 100818 *** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 數(shù)據(jù) 知識 圖譜 生成 方法 裝置 | ||
本發(fā)明公開了一種數(shù)據(jù)湖的知識圖譜生成方法及裝置,涉及大數(shù)據(jù)技術(shù)領(lǐng)域;其中該方法包括:獲取數(shù)據(jù)湖中的多源異構(gòu)數(shù)據(jù),將所述多源異構(gòu)數(shù)據(jù)作為主數(shù)據(jù)存儲至對應(yīng)結(jié)構(gòu)的數(shù)據(jù)庫中;主數(shù)據(jù)包括:結(jié)構(gòu)化主數(shù)據(jù)、半結(jié)構(gòu)化主數(shù)據(jù)、以及非結(jié)構(gòu)化主數(shù)據(jù);查詢獲取結(jié)構(gòu)化主數(shù)據(jù)的數(shù)據(jù)表結(jié)構(gòu),根據(jù)所述數(shù)據(jù)表結(jié)構(gòu)得到結(jié)構(gòu)化主數(shù)據(jù)的元數(shù)據(jù);根據(jù)半結(jié)構(gòu)化主數(shù)據(jù)的格式對半結(jié)構(gòu)化主數(shù)據(jù)進行解析,從解析結(jié)果中提取半結(jié)構(gòu)化主數(shù)據(jù)的元數(shù)據(jù);調(diào)用各非結(jié)構(gòu)化主數(shù)據(jù)對應(yīng)的算子提取非結(jié)構(gòu)化主數(shù)據(jù)的元數(shù)據(jù);利用知識圖譜將各元數(shù)據(jù)進行融合關(guān)聯(lián),得到數(shù)據(jù)湖對應(yīng)的知識圖譜網(wǎng)絡(luò)。本發(fā)明可以將數(shù)據(jù)湖中的數(shù)據(jù)進行有效關(guān)聯(lián),避免出現(xiàn)數(shù)據(jù)沼澤。
技術(shù)領(lǐng)域
本發(fā)明涉及大數(shù)據(jù)技術(shù)領(lǐng)域,尤其涉及數(shù)據(jù)湖的知識圖譜生成方法及裝置。
背景技術(shù)
本部分旨在為權(quán)利要求書中陳述的本發(fā)明實施例提供背景或上下文。此處的描述不因為包括在本部分中就承認是現(xiàn)有技術(shù)。
對于數(shù)據(jù)湖而言,由于其可以獲取全業(yè)務(wù)流程的所有相關(guān)領(lǐng)域的結(jié)構(gòu)化數(shù)據(jù)、以及文本、圖像、語音、視頻等非結(jié)構(gòu)且多元異構(gòu)的數(shù)據(jù)?;跀?shù)據(jù)湖收集和存儲的數(shù)據(jù)形式和類型繁多,因此可以突破在現(xiàn)有大型數(shù)據(jù)倉庫上進行“自上向下”需要業(yè)務(wù)專家來指定規(guī)則模型和邏輯的設(shè)計模式,助力數(shù)據(jù)科學(xué)家以及業(yè)務(wù)專家實現(xiàn)“自底向上”的數(shù)據(jù)分析,從而進行更廣且更深的角度和范圍來進行業(yè)務(wù)的開發(fā)和開展。在數(shù)據(jù)湖中可以將不同業(yè)務(wù)范圍的數(shù)據(jù)關(guān)聯(lián)起來進行一項數(shù)據(jù)分析任務(wù),但是如果進入到數(shù)據(jù)湖的數(shù)據(jù)缺乏一定的數(shù)據(jù)治理,會導(dǎo)致數(shù)據(jù)之間無法進行有效的關(guān)聯(lián),甚至存在缺陷,進而會導(dǎo)致出現(xiàn)使用障礙,產(chǎn)生數(shù)據(jù)使用減少的情況,這進一步就又會引發(fā)存在的數(shù)據(jù)缺陷無法很好的暴露和反映,也即出現(xiàn)“數(shù)據(jù)沼澤”的困境。有效應(yīng)對“數(shù)據(jù)沼澤”出現(xiàn),需要對數(shù)據(jù)湖進行有效的數(shù)據(jù)治理。
發(fā)明內(nèi)容
本發(fā)明實施例提供一種數(shù)據(jù)湖的知識圖譜生成方法,用以實現(xiàn)對數(shù)據(jù)湖中數(shù)據(jù)的有效治理,避免出現(xiàn)數(shù)據(jù)沼澤,該方法包括:
獲取數(shù)據(jù)湖中的多源異構(gòu)數(shù)據(jù),將所述多源異構(gòu)數(shù)據(jù)作為主數(shù)據(jù)存儲至對應(yīng)結(jié)構(gòu)的數(shù)據(jù)庫中;其中,所述主數(shù)據(jù)包括:結(jié)構(gòu)化主數(shù)據(jù)、半結(jié)構(gòu)化主數(shù)據(jù)、以及非結(jié)構(gòu)化主數(shù)據(jù);
查詢獲取結(jié)構(gòu)化主數(shù)據(jù)的數(shù)據(jù)表結(jié)構(gòu),根據(jù)所述數(shù)據(jù)表結(jié)構(gòu)得到結(jié)構(gòu)化主數(shù)據(jù)的元數(shù)據(jù);
根據(jù)半結(jié)構(gòu)化主數(shù)據(jù)的格式對半結(jié)構(gòu)化主數(shù)據(jù)進行解析,從解析結(jié)果中提取半結(jié)構(gòu)化主數(shù)據(jù)的元數(shù)據(jù);
調(diào)用各非結(jié)構(gòu)化主數(shù)據(jù)對應(yīng)的算子提取非結(jié)構(gòu)化主數(shù)據(jù)的元數(shù)據(jù);
利用知識圖譜將各元數(shù)據(jù)進行融合關(guān)聯(lián),得到數(shù)據(jù)湖對應(yīng)的知識圖譜網(wǎng)絡(luò)。
本發(fā)明實施例還提供一種數(shù)據(jù)湖的知識圖譜生成裝置,用以實現(xiàn)對數(shù)據(jù)湖中數(shù)據(jù)的有效治理,避免出現(xiàn)數(shù)據(jù)沼澤,該裝置包括:
獲取模塊,用于獲取數(shù)據(jù)湖中的多源異構(gòu)數(shù)據(jù),將所述多源異構(gòu)數(shù)據(jù)作為主數(shù)據(jù)存儲至對應(yīng)結(jié)構(gòu)的數(shù)據(jù)庫中;其中,所述主數(shù)據(jù)包括:結(jié)構(gòu)化主數(shù)據(jù)、半結(jié)構(gòu)化主數(shù)據(jù)、以及非結(jié)構(gòu)化主數(shù)據(jù);
第一元數(shù)據(jù)提取模塊,用于查詢獲取結(jié)構(gòu)化主數(shù)據(jù)的數(shù)據(jù)表結(jié)構(gòu),根據(jù)所述數(shù)據(jù)表結(jié)構(gòu)得到結(jié)構(gòu)化主數(shù)據(jù)的元數(shù)據(jù);
第二元數(shù)據(jù)提取模塊,用于根據(jù)半結(jié)構(gòu)化主數(shù)據(jù)的格式對半結(jié)構(gòu)化主數(shù)據(jù)進行解析,從解析結(jié)果中提取半結(jié)構(gòu)化主數(shù)據(jù)的元數(shù)據(jù);
第三元數(shù)據(jù)提取模塊,用于調(diào)用各非結(jié)構(gòu)化主數(shù)據(jù)對應(yīng)的算子提取非結(jié)構(gòu)化主數(shù)據(jù)的元數(shù)據(jù);
處理模塊,用于利用知識圖譜將各元數(shù)據(jù)進行融合關(guān)聯(lián),得到數(shù)據(jù)湖對應(yīng)的知識圖譜網(wǎng)絡(luò)。
本發(fā)明實施例還提供一種計算機設(shè)備,包括存儲器、處理器及存儲在存儲器上并可在處理器上運行的計算機程序,所述處理器執(zhí)行所述計算機程序時實現(xiàn)上述數(shù)據(jù)湖的知識圖譜生成方法。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國銀行股份有限公司,未經(jīng)中國銀行股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210120630.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 用于圖譜界面的數(shù)據(jù)處理方法及系統(tǒng)
- 用于內(nèi)容特征圖譜化的特征圖譜布局的服務(wù)器及介質(zhì)
- 圖譜的構(gòu)建方法及裝置、電子設(shè)備
- 信息圖譜構(gòu)建方法、裝置及設(shè)備
- 知識圖譜的完善方法及裝置、數(shù)據(jù)處理方法及裝置
- 一種知識圖譜的構(gòu)建方法、裝置、知識圖譜系統(tǒng)及設(shè)備
- 一種基于知識圖譜的故障判別推理方法
- 一種事件圖譜的匹配方法、裝置、電子設(shè)備及存儲介質(zhì)
- 一種用于創(chuàng)建知識圖譜的計算機設(shè)備
- 一種支持增量實體關(guān)聯(lián)的關(guān)系圖譜計算方法





