[發明專利]圖向量化方法、裝置及電力網圖向量化方法在審
| 申請號: | 202110755180.4 | 申請日: | 2021-07-05 |
| 公開(公告)號: | CN113553396A | 公開(公告)日: | 2021-10-26 |
| 發明(設計)人: | 陳毅波;黃鑫;向行;黃巍;張祖平;蔣破荒;田建偉 | 申請(專利權)人: | 國網湖南省電力有限公司;國網湖南省電力有限公司信息通信分公司;國家電網有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/36;G06F40/117;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 長沙永星專利商標事務所(普通合伙) 43001 | 代理人: | 周詠;米中業 |
| 地址: | 410004 湖南*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 量化 方法 裝置 電力網 | ||
1.一種圖向量化方法,包括如下步驟:
S1.獲取數據集;
S2.對數據集進行建模,從而得到異構信息網絡圖;
S3.在步驟S2得到的異構信息網絡圖中,將元路徑轉換為元圖,并枚舉得到元圖及元圖子圖實例的集合;
S4.對元圖進行一階編碼,并利用與每個節點關聯的元圖集學習各個節點的偏好;
S5.在二階編碼中,通過連接兩個節點的圖集,從而對兩個節點之間的交互進行建模;
S6.整合一階元圖編碼和二階元圖編碼,在給定每個核心節點以及每對核心節點的情況下,對預測得到的包含子圖的總體概率進行優化。
2.根據權利要求1所述的圖向量化方法,其特征在于步驟S2所述的對數據集進行建模,從而得到異構信息網絡圖,具體包括如下步驟:
網絡圖為定義域對象類型Γ的節點和來自關系R的邊的有向圖;異構信息網絡的元模板表示為g=(V,ε,Γ,R),其中V為圖節點,ε為邊;元路徑為定義在網絡圖上的連接兩類對象的一條路徑,并定義為其中Ti用于表示對象類型且Ti∈Γ,Ri表示關系類型且Ri∈R;定義表示對象類型之間的復合關系其中為關系之間的復合算子;
首先,使用人工標注對文檔進行實體標注,然后采用自然語言處理技術提取文本中的實體和關系,然后根據所提取的實體和關系構建異構信息網絡圖。
3.根據權利要求2所述的圖向量化方法,其特征在于步驟S3所述的枚舉得到元圖及元圖子圖實例的集合,具體包括如下步驟:
枚舉異構信息網絡上的元圖,并得到元圖集合M;然后對于元圖集合M中的每一個元圖Mi,枚舉每一個元圖Mi的子圖實例,并得到子圖實例集合Si,所有的子圖實例集合Si組成子圖實例集S。
4.根據權利要求3所述的圖向量化方法,其特征在于步驟S4所述的對元圖進行一階編碼,并利用與每個節點關聯的元圖集學習各個節點的偏好,具體包括如下步驟:
在若干子圖中找到一個核心節點,從而以實例化元圖表征節點傾向于參與的潛在關系;
mi表示嵌入同一空間的元圖且mi∈RD,v表示節點v的編碼表示(向量)且v∈RD;S(v)為包含節點v的子圖集;對于核心節點v,采用預測其包含子圖S(v)的自監督目標;最大化P(S(v)|v;Θ),其中Θ為由所有節點和元圖編碼組成的模型參數,且將S(v)分解為若干個不相交的子集:
其中Si為Mi實例化的子圖;每個子集{S(v)∩Si}均包含由公共元圖Mi實例化的子圖;將由公共元圖實例化的v的所有子圖視為共享相同的底層分布,從而得到以下結果:
其中|S(v)∩Si|為含核心節點v的子圖S(v)與元圖Mi實例化后的子圖Si相交的數量;P(Mi|v;Θ)被如下softmax函數實現:
其中mi為元圖Mi的編碼表示,v為節點v的編碼表示;
考慮所有核心節點,最小化以下負對數似然,以實現一階元圖嵌入:
式中為圖中核心節點且P(Mi|v;Θ)為元圖Mi包含核心節點v的概率。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國網湖南省電力有限公司;國網湖南省電力有限公司信息通信分公司;國家電網有限公司,未經國網湖南省電力有限公司;國網湖南省電力有限公司信息通信分公司;國家電網有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110755180.4/1.html,轉載請聲明來源鉆瓜專利網。





