[發(fā)明專利]垂直領域知識圖譜構建方法、系統(tǒng)、設備及存儲介質在審
| 申請?zhí)枺?/td> | 202110594447.6 | 申請日: | 2021-05-28 |
| 公開(公告)號: | CN113312494A | 公開(公告)日: | 2021-08-27 |
| 發(fā)明(設計)人: | 張中浩;談元鵬;焦飛;徐會芳;仝杰 | 申請(專利權)人: | 中國電力科學研究院有限公司;國家電網有限公司 |
| 主分類號: | G06F16/36 | 分類號: | G06F16/36;G06F16/35;G06F40/205;G06Q50/06 |
| 代理公司: | 北京中巡通大知識產權代理有限公司 11703 | 代理人: | 張弘 |
| 地址: | 100192 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 垂直 領域 知識 圖譜 構建 方法 系統(tǒng) 設備 存儲 介質 | ||
本發(fā)明提供一種垂直領域知識圖譜構建方法、系統(tǒng)、設備及存儲介質,方法包括:獲取電網統(tǒng)一數據模型中業(yè)務數據;對業(yè)務數據中的業(yè)務規(guī)則進行梳理分類;將相關業(yè)務規(guī)則用函數的形式進行描述得到業(yè)務規(guī)則函數;將業(yè)務規(guī)則函數嵌入神經網絡中,并與決策樹進行融合形成文本數據流分類模型;整理業(yè)務規(guī)則形成規(guī)則參數,形成激活函數對實體、關系原抽取算法中激活函數進行替代,得到融合規(guī)則的實體關系抽取算法;基于融合規(guī)則的實體關系抽取算法,對統(tǒng)一數據模型進行實體關系抽取,并依據實體關系抽取結果構建知識圖譜。通過鏈接不同業(yè)務中通用實體及關聯(lián)業(yè)務,確保不同業(yè)務圖譜之間信息互聯(lián),有助于提升垂直領域知識圖譜構建與應用效果。
技術領域
本發(fā)明屬于垂直領域知識圖譜構建與應用技術領域,特別涉及一種垂直領域知識圖譜構建方法、系統(tǒng)、設備及存儲介質。
背景技術
統(tǒng)一數據模型是一種基于面向對象建模技術而構建的企業(yè)數據模型,是參考國際標準和行業(yè)最佳實踐,結合對應企業(yè)的核心業(yè)務需求,采用“業(yè)務需求驅動自頂向下”和“基于現(xiàn)狀驅動自下向上”相結合的模式進行構建的一種數據物理模型,其中包含了多個子業(yè)務領域中的數據。統(tǒng)一數據模型雖然統(tǒng)一采集數據,但數據之間的關聯(lián)性較弱,難以對多業(yè)務領域數據進行貫通分析。近年知識圖譜作為知識性數據的管理與應用技術,通過實體-關系-屬性的三元組形式,打通了業(yè)務數據之間的鏈接壁壘,為統(tǒng)一數據模型的知識管理提供了一種重要方法。因此結合知識圖譜技術對統(tǒng)一數據模型的進行知識應用改造,從而建立語義級互操作的統(tǒng)一數據服務,實現(xiàn)數據的高效、智能化查詢及保證數據的跨業(yè)務貫通,有助于實現(xiàn)統(tǒng)一數據模型文本數據的高效應用與智能分析。
目前針對統(tǒng)一信息模型中的業(yè)務數據構建知識圖譜時,往往從算法技術本身出發(fā),對業(yè)務規(guī)則考慮較少,因此在知識圖譜構建過程中,存在知識體系繁雜、實體關系抽取結果難以滿足業(yè)務規(guī)則等問題。
發(fā)明內容
為了改進目前知識圖譜構建存在的問題,本發(fā)明提供一種垂直領域知識圖譜構建方法、系統(tǒng)、設備及存儲介質,該方法通過設計引入業(yè)務規(guī)則的文本數據分類及實體關系抽取方法,改進基于統(tǒng)一數據模型的領域知識圖譜構建技術,提升知識圖譜與統(tǒng)一數據模型中業(yè)務的耦合性。
為達到上述目的,本發(fā)明采用了以下技術方案:
一種垂直領域知識圖譜構建方法,包括以下步驟:
獲取電網統(tǒng)一數據模型中業(yè)務數據;
對業(yè)務數據中的業(yè)務規(guī)則進行梳理,將業(yè)務規(guī)則用函數表達得到業(yè)務規(guī)則映射函數;
將規(guī)則映射函數嵌入神經網絡中,并與決策樹進行融合形成文本數據流分類模型,將文本數據分流到不同業(yè)務類型中;針對文本數據流分類模型分類后的文本數據進行實體與關系抽取得到實體關系抽取算法;
結合業(yè)務規(guī)則映射函數,得到規(guī)則系數,將規(guī)則系數引入實體關系抽取算法的激活函數中,形成融合業(yè)務規(guī)則的實體與關系抽取算法,
基于融合規(guī)則的實體關系抽取算法對電網統(tǒng)一數據模型進行實體關系抽取,并依據實體關系抽取結果構建知識圖譜。
作為本發(fā)明的進一步改進,所述對業(yè)務數據中的業(yè)務規(guī)則進行梳理具體包括:
分析電網統(tǒng)一數據模型中不同業(yè)務文本數據的規(guī)則與約束條件,梳理構建語料關系網絡中需要遵循的規(guī)則,列出規(guī)則集合;
梳理規(guī)則集合,將規(guī)則分為機制性規(guī)則、約束性規(guī)則、從屬性規(guī)則;其中,機制性規(guī)則是地點后常與線路、廠站名相連接;約束性規(guī)則是文本中以名詞+數字的表述;從屬性規(guī)則是文本中為輸電領域相關詞匯;
統(tǒng)計不同類型規(guī)則,并整合與描述得到文本數據的業(yè)務規(guī)則。
作為本發(fā)明的進一步改進,所述將業(yè)務規(guī)則用函數表達得到業(yè)務規(guī)則映射函數具體包括:
將業(yè)務規(guī)則中機制與條件約束轉化為函數形式;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國電力科學研究院有限公司;國家電網有限公司,未經中國電力科學研究院有限公司;國家電網有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110594447.6/2.html,轉載請聲明來源鉆瓜專利網。





