[發明專利]一種基于無監督生成網絡的多編碼體系互遷移方法在審
| 申請號: | 202110905911.9 | 申請日: | 2021-08-09 |
| 公開(公告)號: | CN113673251A | 公開(公告)日: | 2021-11-19 |
| 發明(設計)人: | 傅駿偉;王豆;郭鼎;姜志鋒;孫永平;吳林峰;鄭必君;劉凱銳;吳業成;俞榮棟 | 申請(專利權)人: | 浙江浙能技術研究院有限公司 |
| 主分類號: | G06F40/30 | 分類號: | G06F40/30;G06F40/126;G06F40/242;G06F40/284;G06F40/289;G06K9/62 |
| 代理公司: | 杭州九洲專利事務所有限公司 33101 | 代理人: | 張羽振 |
| 地址: | 311121 浙江省杭州市余*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 監督 生成 網絡 編碼 體系 遷移 方法 | ||
本發明涉及一種基于無監督生成網絡的多編碼體系互遷移方法,包括步驟:通過采集設備獲取編碼規則A下的編碼與語義描述的數據集;由兩種規則編碼數據集分別進行等量的隨機采樣。本發明的有益效果是:本發明采用無監督多編碼體系互遷移模型,通過采集設備獲取數據集,對數據集中數據進行隨機采樣,并劃分為訓練集和測試集,用于訓練無監督多編碼體系互遷移模型,繞開人工標注的流程,工作量小、求證簡單、出錯率低;本發明通過無數據標注方法實現無監督的多編碼體系互相遷移,克服了傳統底層數據治理標準化、統一化方法僅用于設備編碼,尚未提出解決方案破解不同編碼體系下的自動映射問題。
技術領域
本發明屬于電廠信息技術領域,尤其涉及一種基于無監督生成網絡的多編碼體系互遷移方法。
背景技術
目前主流的編碼體系包括德國主導的電廠標識系統(KKS)、英國主導的通用核心編碼(CCC)、美國主導的標準文檔編碼(SDN)。這些編碼規則在理念上均實現了生產過程的標準化管理,但在細節上仍有較大的區別。由于KKS編碼涵蓋范圍廣,包括工藝、系統、設備、部件、位置等屬性,符合國內各大電廠的建設要求,因此KKS編碼在國內更為流行。目前KKS編碼編制工作主要由電力設計院與設備廠家完成,在實際運行過程中會出現編碼新增或修改往往會出現不符合標準編碼的情況。同時,由于KKS標準編碼規則也會更新升級,歷史較長的發電企業不僅需要大量人力物力保證機組的正常運行,還要更新現有的系統功能,這給KKS編碼工作帶來了不小的挑戰。經過對現有技術檢索,發明專利CN201911292634.8提出一種基于改進型KKS編碼規則的電廠數據輔助編碼系統,該技術方案對原有KKS編碼規則進行了改進,能夠減少同類型電廠重復編碼工作量以及同電廠不同機組之間重復編碼工作量,提高編碼的效率。另外,發明專利CN201410175730.5提出一種電廠設備元件KKS編碼自動生成方法,該方法通過建立動態目錄樹讀取設備元件的位置、編碼及數量并進行自動編碼。上述兩種方法僅用于設備編碼,尚未提出解決方案破解不同編碼體系下的自動映射問題。另外,選擇有監督的模型訓練方法仍無法繞開人工標注的流程,存在工作量大、求證繁瑣、出錯率高等問題。綜合上述情況,多編碼體系下的自動映射任務在集團級發電企業信息化智能化進程中,依舊是一項亟待解決的難題。
發明內容
本發明的目的是克服現有技術中的不足,提供一種基于無監督生成網絡的多編碼體系互遷移方法。
這種基于無監督生成網絡的多編碼體系互遷移方法,包括以下步驟:
步驟1、通過采集設備獲取編碼規則A下的編碼與語義描述的數據集:,其中為編碼,為語義描述,
步驟2、由步驟1獲得的兩種規則編碼數據集和分別進行等量
步驟3、根據步驟2得到的數據集、、、,對編碼和語義描述進行分詞,建立編碼實體字典,其中
步驟4、根據步驟2得到的數據集、、、,步驟3獲得的編碼實體字典、語義描述實體字典,對編碼與語義描述進行文本向量化表征,得到編碼向量和描述向量;
步驟5、通過由步驟2獲得的編碼規則A下的訓練集和編碼規則B下的訓練集,訓練無監督多編碼體系互遷移模型,無監督多編碼體系互遷移模型由編碼網絡與解碼網絡組成;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于浙江浙能技術研究院有限公司,未經浙江浙能技術研究院有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110905911.9/2.html,轉載請聲明來源鉆瓜專利網。





