[發(fā)明專利]基于知識圖譜的火電廠多源數(shù)據(jù)融合方法與裝置在審
| 申請?zhí)枺?/td> | 201910984801.9 | 申請日: | 2019-10-16 |
| 公開(公告)號: | CN110781249A | 公開(公告)日: | 2020-02-11 |
| 發(fā)明(設(shè)計)人: | 蔣蓬勃;白帆;李友志;王繼強(qiáng);蘇濤;盧意;蘇京彬;宋峰 | 申請(專利權(quán))人: | 華電國際電力股份有限公司技術(shù)服務(wù)分公司;華電萊州發(fā)電有限公司 |
| 主分類號: | G06F16/28 | 分類號: | G06F16/28;G06F40/295;G06F40/242;G06F40/247;G06Q50/06 |
| 代理公司: | 37297 濟(jì)南寶宸專利代理事務(wù)所(普通合伙) | 代理人: | 荊向勇 |
| 地址: | 250000 山東*** | 國省代碼: | 山東;37 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 圖譜 多源數(shù)據(jù) 構(gòu)建 知識庫 數(shù)據(jù)處理領(lǐng)域 數(shù)據(jù)融合技術(shù) 領(lǐng)域知識 難點(diǎn)問題 行業(yè)應(yīng)用 行業(yè)知識 有效整合 融合 分散式 火電廠 火電 電廠 更新 申請 | ||
1.一種基于知識圖譜的火電廠多源數(shù)據(jù)融合方法,其特征在于:包括以下步驟:
步驟S101,根據(jù)火電廠設(shè)備編碼的標(biāo)準(zhǔn)化體系以及通用的數(shù)據(jù)標(biāo)準(zhǔn)建立知識圖譜的基礎(chǔ)架構(gòu),知識圖譜在邏輯上分為模式層與數(shù)據(jù)層,數(shù)據(jù)層主要是由一系列的事實組成,而知識將以事實為單位進(jìn)行存儲;
步驟S102,將基礎(chǔ)架構(gòu)中的各個實體之間的關(guān)系進(jìn)行統(tǒng)一規(guī)范,得到具有標(biāo)準(zhǔn)規(guī)范的標(biāo)準(zhǔn)化字典表;
步驟S103,獲取與知識圖譜中的內(nèi)容相關(guān)的結(jié)構(gòu)化數(shù)據(jù):從包括火電廠設(shè)備特性數(shù)據(jù)、故障數(shù)據(jù)、維修數(shù)據(jù)等數(shù)據(jù)信息和故障原因及處理方法、值長日志等管理信息,以及設(shè)備運(yùn)行狀態(tài),過程參數(shù),設(shè)備性能的數(shù)據(jù)中,根據(jù)知識圖譜中定義的內(nèi)容,從這些數(shù)據(jù)集中抽取相關(guān)的結(jié)構(gòu)化數(shù)據(jù);
步驟S104,從結(jié)構(gòu)化數(shù)據(jù)中抽取關(guān)鍵實體的實體信息;在步驟S103獲取的火電廠數(shù)據(jù)的基礎(chǔ)上,從結(jié)構(gòu)化數(shù)據(jù)中抽取生產(chǎn)運(yùn)行相關(guān)的關(guān)鍵實體,與知識圖譜中的標(biāo)準(zhǔn)字典表中的概念和屬性進(jìn)行映射,做到實體排齊;
步驟S105,根據(jù)知識圖譜中的標(biāo)準(zhǔn)字典表將不同來源數(shù)據(jù)中所蘊(yùn)含的實體和屬性信息進(jìn)行融合,最終形成一致且規(guī)范的結(jié)構(gòu)化數(shù)據(jù);
步驟S106,基于結(jié)構(gòu)化數(shù)據(jù)生成對應(yīng)的三元組數(shù)據(jù)對,并將三元組數(shù)據(jù)對存儲為知識圖譜。將三元組數(shù)據(jù)存儲到Neo4j圖形數(shù)據(jù)庫。三元組數(shù)據(jù)對是節(jié)點(diǎn)、關(guān)系以及屬性組成,通過這個三元組可以完整地描述任意一個實體的情況。同時,還可以在關(guān)系上賦予屬性,靈活擴(kuò)展知識圖譜的網(wǎng)絡(luò)模型。
2.如權(quán)利要求1所述的基于知識圖譜的火電廠多源數(shù)據(jù)融合方法,其特征在于,所述的步驟S102中,統(tǒng)一規(guī)范具體是指將實體的實體屬性轉(zhuǎn)換成三元組數(shù)據(jù)RDF,根據(jù)三元組數(shù)據(jù)RDF將實體屬性與實體的關(guān)系類型和命名規(guī)則進(jìn)行統(tǒng)一規(guī)范。
3.如權(quán)利要求1所述的基于知識圖譜的火電廠多源數(shù)據(jù)融合方法,其特征在于,所述的步驟S105采取如下步驟實現(xiàn):
步驟S105-1,判斷數(shù)據(jù)中蘊(yùn)含的實體、屬性及關(guān)系是否和標(biāo)準(zhǔn)規(guī)范中所定義的相一致:如果實體、屬性及關(guān)系中存在著較為明顯的不一致,則執(zhí)行步驟S105-2,依賴標(biāo)準(zhǔn)字典表將實體信息進(jìn)行數(shù)據(jù)融合,形成結(jié)構(gòu)化數(shù)據(jù);
步驟S105-2,根據(jù)知識圖譜的規(guī)范定義對實體名稱、實體屬性、實體關(guān)系進(jìn)行映射,在映射的基礎(chǔ)上進(jìn)行融合,形成最終規(guī)范的結(jié)構(gòu)化數(shù)據(jù);具體的:將實體名稱與標(biāo)準(zhǔn)字典表中的內(nèi)容進(jìn)行映射,得到同義的實體名稱,最終確定一個同義實體名;將同義的實體、名稱、屬性及關(guān)系進(jìn)行數(shù)據(jù)融合,形成結(jié)構(gòu)化數(shù)據(jù);
步驟S105-3,對于與規(guī)范標(biāo)準(zhǔn)不一致的其他實體、屬性及關(guān)系,那么將采用提交給人工,進(jìn)行審核編輯的方法,通過人的專業(yè)知識來消除異構(gòu)和不一致的情況,最終實現(xiàn)不同數(shù)據(jù)源和知識圖譜之間的一致性。
4.如權(quán)利要求1所述的基于知識圖譜的火電廠多源數(shù)據(jù)融合裝置,其特征在于,包括
知識圖譜基礎(chǔ)架構(gòu)建立模塊10,用于根據(jù)通用數(shù)據(jù)標(biāo)準(zhǔn)建立知識圖譜的基礎(chǔ)架構(gòu);
標(biāo)準(zhǔn)字典表生成模塊20,用于將基礎(chǔ)架構(gòu)中的各個實體之間的關(guān)系進(jìn)行統(tǒng)一規(guī)范,得到具有標(biāo)準(zhǔn)規(guī)范的標(biāo)準(zhǔn)字典表;
多源數(shù)據(jù)獲取模塊30,用于獲取與知識圖譜中的內(nèi)容相關(guān)的結(jié)構(gòu)化數(shù)據(jù);
數(shù)據(jù)實體抽取模塊40,基于知識圖譜的定義,用于從結(jié)構(gòu)化數(shù)據(jù)中抽取關(guān)鍵實體的實體信息;
多源數(shù)據(jù)融合模塊50,用于根據(jù)知識圖譜及標(biāo)準(zhǔn)字典表將實體名稱、屬性及關(guān)系進(jìn)行數(shù)據(jù)融合,形成結(jié)構(gòu)化數(shù)據(jù);
三元組數(shù)據(jù)存儲模塊60,用于將三元組數(shù)據(jù)對存儲到Neo4J圖數(shù)據(jù)庫中。
5.如權(quán)利要求4所述的基于知識圖譜的火電廠多源數(shù)據(jù)融合裝置,其特征在于,所述的標(biāo)準(zhǔn)字典表生成模塊20包括:
三元組數(shù)據(jù)結(jié)構(gòu)轉(zhuǎn)換單元21,用于將實體的屬性、關(guān)系轉(zhuǎn)換成三元組數(shù)據(jù)RDF;
三元組數(shù)據(jù)統(tǒng)一定義單元22,用于根據(jù)RDF將實體屬性與實體的關(guān)系類型和命名規(guī)則進(jìn)行統(tǒng)一規(guī)范。
6.如權(quán)利要求4所述的基于知識圖譜的火電廠多源數(shù)據(jù)融合裝置,其特征在于,所述的源數(shù)據(jù)融合模塊50,包括
判斷單元51,用于判斷實體信息是否符合標(biāo)準(zhǔn)規(guī)范;
數(shù)據(jù)融合單元52,用于在符合標(biāo)準(zhǔn)規(guī)范的情況下,根據(jù)標(biāo)準(zhǔn)字典表將實體信息進(jìn)行數(shù)據(jù)融合,形成三元組數(shù)據(jù)對。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華電國際電力股份有限公司技術(shù)服務(wù)分公司;華電萊州發(fā)電有限公司,未經(jīng)華電國際電力股份有限公司技術(shù)服務(wù)分公司;華電萊州發(fā)電有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910984801.9/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 用于圖譜界面的數(shù)據(jù)處理方法及系統(tǒng)
- 用于內(nèi)容特征圖譜化的特征圖譜布局的服務(wù)器及介質(zhì)
- 圖譜的構(gòu)建方法及裝置、電子設(shè)備
- 信息圖譜構(gòu)建方法、裝置及設(shè)備
- 知識圖譜的完善方法及裝置、數(shù)據(jù)處理方法及裝置
- 一種知識圖譜的構(gòu)建方法、裝置、知識圖譜系統(tǒng)及設(shè)備
- 一種基于知識圖譜的故障判別推理方法
- 一種事件圖譜的匹配方法、裝置、電子設(shè)備及存儲介質(zhì)
- 一種用于創(chuàng)建知識圖譜的計算機(jī)設(shè)備
- 一種支持增量實體關(guān)聯(lián)的關(guān)系圖譜計算方法
- 用于根據(jù)客戶驅(qū)動的查詢來提供增強(qiáng)匹配的方法和系統(tǒng)
- 一種新穎的多源數(shù)據(jù)模糊聚類算法
- 一種多源海量數(shù)據(jù)處理系統(tǒng)及方法
- 一種船端多源PNT融合與評估系統(tǒng)
- 電網(wǎng)自動化系統(tǒng)多源數(shù)據(jù)接入及展示方法
- 一種工廠多源能耗數(shù)據(jù)并行處理系統(tǒng)及方法
- 用于配電網(wǎng)多源數(shù)據(jù)庫的高吞吐率數(shù)據(jù)處理方法
- 多源多模態(tài)數(shù)據(jù)的處理系統(tǒng)及應(yīng)用該系統(tǒng)的方法
- 一種多源數(shù)據(jù)報表的生成方法、系統(tǒng)以及執(zhí)行方法
- 一種多源異構(gòu)數(shù)據(jù)的描述方法、解析方法及裝置
- 構(gòu)建墊、實體圖像構(gòu)建物和構(gòu)建構(gòu)建物支撐件的方法
- 支持松耦合的軟件構(gòu)建方法、系統(tǒng)及該系統(tǒng)的實現(xiàn)方法
- 版本的構(gòu)建系統(tǒng)及方法
- 工程構(gòu)建系統(tǒng)及其構(gòu)建方法
- 實例構(gòu)建方法、裝置及軟件系統(tǒng)
- 軟件構(gòu)建方法、軟件構(gòu)建裝置和軟件構(gòu)建系統(tǒng)
- 天花板地圖構(gòu)建方法、構(gòu)建裝置以及構(gòu)建程序
- 一種項目構(gòu)建方法、持續(xù)集成系統(tǒng)及終端設(shè)備
- 并行構(gòu)建的方法、裝置及設(shè)備
- 構(gòu)建肺癌預(yù)測模型構(gòu)建方法





