[發明專利]電力運維信息知識圖譜構建方法在審
| 申請號: | 201810189014.0 | 申請日: | 2018-03-08 |
| 公開(公告)號: | CN108460136A | 公開(公告)日: | 2018-08-28 |
| 發明(設計)人: | 連紀文;吳飛;王國強;羅富財;李霆;陳倩;王秋琳;林偉;石靜;李明 | 申請(專利權)人: | 國網福建省電力有限公司;福建億榕信息技術有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06F17/27 |
| 代理公司: | 福州元創專利商標代理有限公司 35100 | 代理人: | 蔡學俊;丘鴻超 |
| 地址: | 350003 福*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 運維 圖譜 電力信息 圖譜構建 信息知識 知識單元 構建 抽取 知識庫 智能化應用 電力領域 電力數據 關系抽取 領域知識 實體關系 實體識別 數據隱藏 數據轉化 信息展現 學習算法 用戶在線 優化存儲 運維系統 知識表示 電網 大機器 關聯性 低維 直觀 孤立 智能 引入 咨詢 學習 | ||
1.一種電力運維信息知識圖譜構建方法,其特征在于,包括以下步驟:
步驟1:對電力系統工單數據進行工單采集,并轉換為文本格式,并根據文本含義屬性劃分為多個文本域;
步驟2:以工單為單位,對工單文本數據進行分詞處理;
步驟3:對文本域進行分組;
步驟4:對各文本域分別進行域分詞處理,采用基于字符串匹配的分詞方法分別對各分組的內容進行詞匯切分;
步驟5:根據無效詞匯表進行無效詞匯過濾,過濾掉無效詞匯和敏感詞匯;
步驟6:將有效詞匯與知識庫中詞匯表進行比對,將新詞匯加入到知識庫的詞匯列表,對己有詞匯進行累加其出現的頻次;
步驟7:抽取加入詞匯的實體關系:通過預先定義實體關系類型及基于實體的特征,抽取實體關系;
步驟8:將實體與實體關系導入圖數據庫;
步驟9:在圖數據庫中完成知識圖譜的繪制。
2.根據權利要求1所述的電力運維信息知識圖譜構建方法,其特征在于:步驟8中,將實體和實體關系轉化為基于RDF的三元組;步驟9中,通過PTransE模型將實體和實體關系進行翻譯和學習,構建成為知識圖譜。
3.根據權利要求1所述的電力運維信息知識圖譜構建方法,其特征在于:步驟2和步驟4中,分詞采用中科院的ICTCLAS系統;
將分詞后的所有詞組成字符表D,,其中表示一個詞,。
4.將每個詞E的詞特征向量表示為,其中代表該詞是否對應字符表D中的,的計算方式如下:
。
5.根據權利要求3所述的電力運維信息知識圖譜構建方法,其特征在于:步驟2和步驟4中,分詞還包括詞性特征的構建:詞性特征的構建與詞特征的構建方式一致。
6.根據權利要求1所述的電力運維信息知識圖譜構建方法,其特征在于:步驟7中,釆用句法分析及詞法分析將實體關系轉化為特征向量,繼而采用機器學習模型進行處理,計算特征向量的相似度,并對實體關系進行分類。
7.根據權利要求1所述的電力運維信息知識圖譜構建方法,其特征在于:步驟7中,所述預先定義實體關系類型及基于實體的特征包括實體特征、實體類型特征、實體對相對位置特征、實體間距離特征和上下文窗口特征。
8.根據權利要求2所述的電力運維信息知識圖譜構建方法,其特征在于:所述PTransE模型將知識圖譜中的關系路徑與關系的向量表達聯系起來,將邏輯推理規則視為向量加法操作,其評分函數為:
其中,表示實體間關系路徑集合,為實體間的一條路徑,等價于TransE的參數模型,的計算公式為
其中是一個歸一化函數,表示頭實體h到尾實體t的關系路徑p的可靠性;表示頭實體h到尾實體t的關系路徑p的勢能函數;
對于路徑集合,其函數如下
其中用于衡量頭實體h到尾實體t的關系路徑p的可靠性,即,
其中實體h到實體t的路徑關系p,,從實體h通過路徑關系p,將路徑表示為,其中,;對于任何實體,在的關系的直接用關系來表示;首先對實體h賦予權重1,然后對函數進行不斷迭代,獲得t的權重。
9.根據權利要求1所述的電力運維信息知識圖譜構建方法,其特征在于:對電力系統工單數據采用Python的urllib2包對非結構化文本數據的內容進行采集;采用BeautifulSoup包對采集的內容進行解析;采用R環境下的Rwordseg包進行分詞。
10.根據權利要求1所述的電力運維信息知識圖譜構建方法,其特征在于:所述圖數據庫為:Neo4j圖數據庫。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國網福建省電力有限公司;福建億榕信息技術有限公司,未經國網福建省電力有限公司;福建億榕信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810189014.0/1.html,轉載請聲明來源鉆瓜專利網。





