[發(fā)明專利]一種電力領(lǐng)域隱患事件文本分類方法及其相關(guān)裝置有效
| 申請?zhí)枺?/td> | 202110859433.2 | 申請日: | 2021-07-28 |
| 公開(公告)號: | CN113535906B | 公開(公告)日: | 2023-01-17 |
| 發(fā)明(設(shè)計)人: | 何超勛;楊秋勇;江疆;彭澤武;馮歆堯;吳金銘;王柳佳 | 申請(專利權(quán))人: | 廣東電網(wǎng)有限責(zé)任公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/35;G06F40/279;G06Q50/06;G06N3/04;G06N3/08 |
| 代理公司: | 北京集佳知識產(chǎn)權(quán)代理有限公司 11227 | 代理人: | 沈闖 |
| 地址: | 510080 廣東省廣州*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 電力 領(lǐng)域 隱患 事件 文本 分類 方法 及其 相關(guān) 裝置 | ||
本申請公開了一種電力領(lǐng)域隱患事件文本分類方法及其相關(guān)裝置,構(gòu)建包括有標簽樣本的風(fēng)險隱患庫和包括待分類樣本的無標簽樣本庫;通過預(yù)處理后的有標簽樣本對預(yù)置文本分類網(wǎng)絡(luò)進行訓(xùn)練得到文本分類模型;通過文本分類模型對預(yù)處理后的待分類樣本進行文本分類,根據(jù)分類類別概率獲取置信度;將置信度最高的第一預(yù)置數(shù)量個待分類樣本添加到風(fēng)險隱患庫,剩余待分類樣本放回?zé)o標簽樣本庫;通過文本分類模型對更新后的風(fēng)險隱患庫中有標簽樣本進行文本分類并獲取置信度;將置信度最低的第二預(yù)置數(shù)據(jù)量個更新后的風(fēng)險隱患庫中的有標簽樣本添加到風(fēng)險隱患庫回收站,改善了現(xiàn)有的電力領(lǐng)域風(fēng)險隱患事件文本采用人工審查方式,存在效率低和耗時長的技術(shù)問題。
技術(shù)領(lǐng)域
本申請涉及文本分類技術(shù)領(lǐng)域,尤其涉及一種電力領(lǐng)域隱患事件文本分類方法及其相關(guān)裝置。
背景技術(shù)
電力供應(yīng)關(guān)系民生,安全生產(chǎn)對電力企業(yè)尤為重要。雖然電力企業(yè)制定了安全規(guī)程,以規(guī)范電網(wǎng)運行過程,保障電網(wǎng)設(shè)備和人員安全。但事故和未遂事故仍時有發(fā)生,大量的事故事件記錄的描述中暴露出操作過程中存在的問題。通過對這些文本記錄的調(diào)查和統(tǒng)計分析,可以為采取有針對性的控制措施,防止事故的發(fā)生,提高安全管理和監(jiān)督水平。然而,這些文本通常都是依賴于人工方式進行審查,效率低,費時長,工作量大。因此,提供一種電力領(lǐng)域隱患事件文本分類方法是本領(lǐng)域技術(shù)人員亟需解決的技術(shù)問題。
發(fā)明內(nèi)容
本申請?zhí)峁┝艘环N電力領(lǐng)域隱患事件文本分類方法及其相關(guān)裝置,用于改善現(xiàn)有的電力領(lǐng)域風(fēng)險隱患事件文本采用人工審查方式,存在效率低和耗時長的技術(shù)問題。
有鑒于此,本申請第一方面提供了一種電力領(lǐng)域隱患事件文本分類方法,包括:
S1、構(gòu)建包括有標簽樣本的風(fēng)險隱患庫和包括待分類樣本的無標簽樣本庫,所述有標簽樣本為有標簽的電力領(lǐng)域風(fēng)險隱患事件文本,所述待分類樣本為無標簽的電力領(lǐng)域事件文本;
S2、對所述有標簽樣本的置信度進行初始化,并對所述有標簽樣本進行預(yù)處理后,通過預(yù)處理后的所述有標簽樣本對預(yù)置文本分類網(wǎng)絡(luò)進行訓(xùn)練,得到文本分類模型;
S3、從所述無標簽樣本庫隨機抽取若干所述待分類樣本進行預(yù)處理后輸入到所述文本分類模型進行文本分類,并根據(jù)所述待分類樣本對應(yīng)的分類類別概率獲取該待分類樣本的置信度;
S4、將置信度最高的第一預(yù)置數(shù)量個所述待分類樣本添加到當(dāng)前的風(fēng)險隱患庫,得到更新后的所述風(fēng)險隱患庫,剩余的待分類樣本放回所述無標簽樣本庫;
S5、通過所述文本分類模型對更新后的所述風(fēng)險隱患庫中的有標簽樣本進行文本分類,并基于更新后的所述風(fēng)險隱患庫中各有標簽樣本的分類類別概率獲取置信度;
S6、將置信度最低的第二預(yù)置數(shù)據(jù)量個更新后的所述風(fēng)險隱患庫中的有標簽樣本添加到風(fēng)險隱患庫回收站,并返回步驟S3,直至所述無標簽樣本庫中的樣本數(shù)量為0。
可選的,所述預(yù)處理包括分詞和/或去停用詞。
可選的,所述預(yù)置文本分類網(wǎng)絡(luò)包括前向長短期記憶網(wǎng)絡(luò)、后向長短期記憶網(wǎng)絡(luò)、注意力層、Dropout層和歸一化層;
所述前向長短期記憶網(wǎng)絡(luò)和所述后向長短期記憶網(wǎng)絡(luò)的輸出端均連接所述注意力層的輸入端;
所述注意力層的輸出端與所述Dropout層的輸入端連接,并與所述歸一化層跨越連接;
所述Dropout層的輸出端與所述歸一化層的輸入端連接。
可選的,所述根據(jù)所述待分類樣本對應(yīng)的分類類別概率獲取該待分類樣本的置信度,包括:
將所述待分類樣本對應(yīng)的分類類別概率中的最高概率值作為該待分類樣本的置信度。
可選的,步驟S6之后還包括:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣東電網(wǎng)有限責(zé)任公司,未經(jīng)廣東電網(wǎng)有限責(zé)任公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110859433.2/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 電力控制器、電力生成系統(tǒng)以及電力控制器的控制方法
- 電力供給裝置、電力接收裝置和包括電力接收裝置的車輛以及用于電力供給系統(tǒng)的控制方法
- 電力接收裝置、電力傳送裝置及其控制方法
- 一種智能電力客服系統(tǒng)的構(gòu)建方法及系統(tǒng)
- 無線電力傳輸系統(tǒng)、無線電力發(fā)送裝置和無線電力接收裝置
- 一種電力監(jiān)控平臺數(shù)據(jù)信息映射匹配方法及系統(tǒng)
- 用于電力分配的系統(tǒng)和方法
- 電力傳輸裝置、電力接收裝置和電力傳輸裝置的控制方法
- 一種電力傳輸線圈無線傳輸電力的無線電力傳輸系統(tǒng)
- 一種電力運行數(shù)據(jù)監(jiān)控系統(tǒng)





