[發明專利]一種電機故障知識抽取系統及方法在審
| 申請號: | 202010870508.2 | 申請日: | 2020-08-26 |
| 公開(公告)號: | CN112000791A | 公開(公告)日: | 2020-11-27 |
| 發明(設計)人: | 王克劍;毛靜軒;苗東旭;姜漫利;曲曉峰;趙明;傅磊;張德陽 | 申請(專利權)人: | 哈電發電設備國家工程研究中心有限公司 |
| 主分類號: | G06F16/332 | 分類號: | G06F16/332;G06F16/35;G06F40/279;G06K9/62 |
| 代理公司: | 哈爾濱市偉晨專利代理事務所(普通合伙) 23209 | 代理人: | 韓立巖 |
| 地址: | 150000 黑龍江*** | 國省代碼: | 黑龍江;23 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 電機 故障 知識 抽取 系統 方法 | ||
1.一種電機故障知識抽取系統,其特征在于:該系統包括數據采集模塊,數據預處理模塊,輔助訓練工具模塊、模型訓練模塊和知識融合模塊;
所述的數據采集模塊負責采集故障數據后發送給數據預處理模塊;
所述的數據預處理模塊將采集后的數據進行預處理;
所述的輔助訓練工具模塊抽取相關的系統配套程序;
所述的模型訓練模塊與數據預處理模塊連接,將預處理的數據進行模型訓練;
所述的模型訓練模塊和所述的知識融合模塊連接,將預處理的數據進行最后的融合處理。
2.根據權利要求1所述的一種電機故障知識抽取系統,其特征在于:數據采集模塊與手機端和PC端兩部分建立連接,PC端為手機端提供接口,其中手機端主要采用了微信小程序開發,主要包含業務邏輯模塊、知識展示模塊和知識作答模塊三大主要功能模塊:
業務邏輯模塊,主要包含電機相關專家業務注冊、登錄等業務;
知識展示模塊,向用戶展示電機故障知識問卷,同時包括已經作答的問卷;
知識作答模塊,支持用戶選擇自己感興趣電機故障知識問卷并作答,作答結果提交后保存到后臺。
3.根據權利要求1所述的一種電機故障知識抽取系統,其特征在于:
所述的數據采集模塊包括注冊信息模塊、用戶數據采集模塊和文獻數據采集模塊;
其中用戶數據采集模塊所需的用戶部分的數據從注冊信息模塊采集;
所述的數據預處理模塊包括文本格式轉換模塊,文本編碼轉換模塊和文本規范化模塊;
所述的輔助訓練工具模塊包括文本分類工具、數據標注工具、數據庫監聽工具和數據爬取工具;
所述的模型訓練模塊中的模型為BERT模型;
所述的知識融合模塊包括知識預處理模塊、屬性相似度連接模塊和知識嵌入及分塊匹配模塊。
4.根據權利要求3所述的一種電機故障知識抽取系統,其特征在于:所述的知識預處理模塊包括語法預處理模塊和文本預處理模塊兩部分。
5.一種電機故障知識抽取方法,由上述權利要求1-4任一一項所述的系統作為支持而實現的,其特征在于:方法步驟如下:
步驟一,所述的數據采集模塊中,用戶和管理員通過所述的注冊信息模塊對各自的信息進行注冊,用戶上傳個人信息或對問卷的答案至所述的用戶數據采集模塊由管理員進行處理,所述的文獻數據采集模塊選擇資料中的數據作為該系統的訓練模型支持;
步驟二,所述的數據預處理模塊中,文本格式轉換模塊將不同種類的電機故障的文本格式進行統一處理,所述的文本編碼轉換模塊將不同種類的文本編碼進行統一編碼,所述的文本規范化模塊將文本用標簽進行標注后通過輔助訓練工具模塊進行處理;
步驟三,通過所述的輔助訓練工具模塊對步驟二中得到的標簽進行降低開發難度的處理,包括所述的文本分類工具進行文本中噪音降噪、用戶通過所述的數據標注工具進行回答、所述的數據庫監聽工具對用戶的回答進行數據監聽以及所述的數據爬取工具對電機故障的文章的爬取;
步驟四,所述的模型訓練模塊中模型,利用BERT模型的底層結構Transformer結構模型,通過自注意力機制進行電機故障知識抽取結果對比分析;
步驟五,所述的知識融合模塊在數據對齊后進行實體匹配,其包括所述的知識預處理模塊對上述獲得的知識數據進行預處理,所述的屬性相似度連接模塊對知識數據的相似度進行計算,以及知識嵌入及分塊匹配模塊進行實體匹配、過濾從而完備知識圖譜。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈電發電設備國家工程研究中心有限公司,未經哈電發電設備國家工程研究中心有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010870508.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種半導體封裝的夾片器
- 下一篇:一種液氨紅豆杉針織面料及其制備方法





