[發(fā)明專利]一種利用文字識別識別電氣設(shè)備中監(jiān)測數(shù)據(jù)的處理方法在審
| 申請?zhí)枺?/td> | 202010860366.1 | 申請日: | 2020-08-24 |
| 公開(公告)號: | CN112182205A | 公開(公告)日: | 2021-01-05 |
| 發(fā)明(設(shè)計)人: | 李根;梅華威;劉冬;張帥 | 申請(專利權(quán))人: | 華北電力大學(xué)(保定) |
| 主分類號: | G06F16/35 | 分類號: | G06F16/35;G06F40/216;G06F40/279;G06N3/04;G06Q50/06 |
| 代理公司: | 石家莊新世紀(jì)專利商標(biāo)事務(wù)所有限公司 13100 | 代理人: | 張棟然 |
| 地址: | 071000 河北*** | 國省代碼: | 河北;13 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 利用 文字 識別 電氣設(shè)備 監(jiān)測 數(shù)據(jù) 處理 方法 | ||
本發(fā)明涉及一種利用文字識別識別電氣設(shè)備中監(jiān)測數(shù)據(jù)的處理方法,其包括如下步驟:建立故障文本空間向量模型,進(jìn)行文本特征提取;機(jī)器學(xué)習(xí)算法應(yīng)用,采用機(jī)器學(xué)習(xí)建立分類模型,將電氣設(shè)備故障文本分類;采用DA?BiLSTM分類模型進(jìn)行故障文本識別;本發(fā)明利用OCR技術(shù)實(shí)現(xiàn)了自動識別文本記錄的故障數(shù)據(jù),可以為電力系統(tǒng)故障文本分類提供了有力支撐,不僅能夠提高故障文本分類的準(zhǔn)確率,而且減少了人工分類的成本。
技術(shù)領(lǐng)域
本發(fā)明涉及一種利用文字識別識別電氣設(shè)備中監(jiān)測數(shù)據(jù)的處理方法。
背景技術(shù)
電力系統(tǒng)的復(fù)雜性與日俱增,電氣設(shè)備的故障信息也正在以前所未有的速度增長,并且這些故障數(shù)據(jù)呈現(xiàn)出多元化的發(fā)展方向。原來都是通過人工的方式對故障進(jìn)行記錄,但是這種方式記錄速度非常慢,無法滿足當(dāng)前信息快速增長下對故障的記錄需求,目前對設(shè)備故障記錄方式有文本、圖片、視頻、音頻等口,其中文本記錄為故障數(shù)據(jù)的主要記錄方式,這些數(shù)據(jù)中往往記錄著電氣設(shè)備中隱藏的重要故障,而這些故障不易被發(fā)現(xiàn)又對設(shè)備及其重要。因此,對這些文本故障信息進(jìn)行快速有效的識別分類非常困難。
發(fā)明內(nèi)容
本發(fā)明所要解決的技術(shù)問題是提供一種利用文字識別識別電氣設(shè)備中監(jiān)測數(shù)據(jù)的處理方法,可以實(shí)現(xiàn)檢測數(shù)據(jù)的自動識別,減少人工分類成本。
本發(fā)明所采用的技術(shù)方案是:一種利用文字識別識別電氣設(shè)備中監(jiān)測數(shù)據(jù)的處理方法,其特征在于其包括如下步驟:
建立故障文本空間向量模型,進(jìn)行文本特征提取;
機(jī)器學(xué)習(xí)算法應(yīng)用,采用機(jī)器學(xué)習(xí)建立分類模型,將電氣設(shè)備故障文本分類;
采用DA-BiLSTM分類模型進(jìn)行故障文本識別。
進(jìn)一步的,建立故障文本空間向量模型時,首先分析電氣設(shè)備故障文本特點(diǎn),根據(jù)特點(diǎn)選擇文本預(yù)處理方法,然后對預(yù)處理后的文本進(jìn)行特征提取。
進(jìn)一步的,所述文本預(yù)處理方法包括分詞、去除停用詞。
進(jìn)一步的,在對文本進(jìn)行特征提取時,采用卡方統(tǒng)計量、互信息法以及MCHI方法。
進(jìn)一步的,機(jī)器學(xué)習(xí)算法應(yīng)用過程中,首先對故障數(shù)據(jù)進(jìn)行人工篩選,將存在明顯誤差、稀疏的故障數(shù)據(jù)去除,然后將處理后的數(shù)據(jù)按照預(yù)處理流程進(jìn)行篩選,分別應(yīng)用到支持向量機(jī)、k-最近鄰、Logistic回歸、Gradicnt Boosting、樸素貝葉斯機(jī)器學(xué)習(xí)分類模型中,對文本進(jìn)行分類。
進(jìn)一步的,在對文本分類之前,對模型進(jìn)行預(yù)定義分類評估指標(biāo),根據(jù)電力設(shè)備缺陷的分類標(biāo)準(zhǔn),將電力系統(tǒng)故障評估分為一般、重要、緊急3個等級。
進(jìn)一步的,采用DA-BiLSTM分類模型進(jìn)行故障文本識別的具體方法為:
語映射為一組向量實(shí)現(xiàn)對文本的分類;
DA-BiLSTM模型是將深層注意力機(jī)制和雙層雙向LSTM模型融合,能判斷重要文本信息并進(jìn)行分類,DA-BiLSTM模型結(jié)構(gòu)包含嵌入層、雙向LSTM層、注意力層和輸出層;
嵌入層:該層的輸入是由一組文本序列組成的故障文本信息,將不同的文本序列Y={y1,y2,...,yn}映射到文本詞向量空間RE;其中,E是嵌入層的長度,n是文本中詞的個數(shù);
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華北電力大學(xué)(保定),未經(jīng)華北電力大學(xué)(保定)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010860366.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





