[發明專利]一種基于語義分析的電力事故風險預警方法及系統在審
| 申請號: | 202010048769.6 | 申請日: | 2020-01-16 |
| 公開(公告)號: | CN111275574A | 公開(公告)日: | 2020-06-12 |
| 發明(設計)人: | 盧丹;許長清;余曉鵬;張建立;王利利;張琳娟 | 申請(專利權)人: | 國家電網有限公司;國網河南省電力公司經濟技術研究院 |
| 主分類號: | G06Q50/06 | 分類號: | G06Q50/06;G06Q10/06;G06Q10/04;G06K9/62;G06F16/35 |
| 代理公司: | 北京勁創知識產權代理事務所(普通合伙) 11589 | 代理人: | 張鐵蘭 |
| 地址: | 100000 *** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 語義 分析 電力 事故 風險 預警 方法 系統 | ||
1.一種基于語義分析的電力事故風險預警方法,其特征在于,包括:
構建引起電網事故的工作票文本和事故數據庫;
對所述引起電網事故的工作票文本和所述事故數據庫進行文本預處理,得到預處理后的工作票文本和預處理后的事故數據庫;
對所述預處理后的工作票文本以及預處理后的事故數據庫進行特征向量提取,得到工作票文本的特征向量;
根據所述工作票文本的特征向量進行詞語語義相似度計算,得到工作票文本的相似度矩陣;
根據所述相似度矩陣對所述預處理后的工作票文本以及預處理后的事故數據庫進行聚類處理,得到聚類模型;
獲取待預測的工作票文本;
根據所述聚類模型對所述待預測的工作票文本進行預測,得到風險結果。
2.根據權利要求1所述的基于語義分析的電力事故風險預警方法,其特征在于,所述對所述引起電網事故的工作票文本和所述事故數據庫進行文本預處理,得到預處理后的工作票文本和預處理后的事故數據庫,具體包括:
對所述引起電網事故的工作票文本和所述事故數據庫進行文本分詞、無效詞語刪除、替換含義一致性詞語和分析詞性預處理,得到預處理后的工作票文本和預處理后的事故數據庫。
3.根據權利要求1所述的基于語義分析的電力事故風險預警方法,其特征在于,所述對所述預處理后的工作票文本以及預處理后的事故數據庫進行特征向量提取,得到工作票文本的特征向量,具體包括:
根據所述預處理后的工作票文本以及預處理后的事故數據庫,利用業務模板驅動的實體發現和基于業務特征的實體顯著因子方法進行特征向量提取,得到工作票文本的特征向量。
4.根據權利要求1所述的基于語義分析的電力事故風險預警方法,其特征在于,所述根據所述工作票文本的特征向量進行詞語語義相似度計算,得到工作票文本的相似度矩陣,具體包括:
根據所述工作票文本的特征向量采用公式TextSim(Vi,Vj)=α*VectSim(Vi,Vj)+(1-α)*CosSim(Vi,Vj)進行詞語語義相似度計算,得到工作票文本的相似度矩陣;
其中,Vi、Vj為兩篇不同工作票文本的特征詞向量,Vi=(ti1,ti2,ti3,...,tim),Vj=(tj1,tj2,tj3,...,tjm),α為詞項向量Vi和Vj之間相似度的加權因子;VectSim(Vi,Vj)為詞向量Vi和Vj之間的語義相似度,Sim(tjl,tik)表示關鍵詞tjl、tik之間的語義相似度,CosSim(Vi,Vj)為向量Vi和向量Vj之間的余弦相似度,δ為向量Vi和向量Vj中出現相同詞項的數目。
5.根據權利要求1所述的基于語義分析的電力事故風險預警方法,其特征在于,所述根據所述相似度矩陣對所述預處理后的工作票文本以及預處理后的事故數據庫進行聚類處理,得到聚類模型,具體包括:
根據所述相似度矩陣對所述預處理后的工作票文本以及預處理后的事故數據庫采用K-均值方法進行聚類處理,得到聚類模型。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國家電網有限公司;國網河南省電力公司經濟技術研究院,未經國家電網有限公司;國網河南省電力公司經濟技術研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010048769.6/1.html,轉載請聲明來源鉆瓜專利網。





