[發明專利]一種綜合能源系統運行事故分析的數據集分類方法有效
| 申請號: | 202210540826.1 | 申請日: | 2022-05-19 |
| 公開(公告)號: | CN114638558B | 公開(公告)日: | 2022-08-23 |
| 發明(設計)人: | 李強;胡浩瀚;趙峰;李溫靜;劉永清;郭正雄;閆松;董建強;佘文魁;朱傳晶;紀元;戴彬;劉曉靜;張來東;彭曉武;田永茂;張雪成;倪升亞;李琳;張健;韓永躍;任承歡;張瑞超;強凱 | 申請(專利權)人: | 天津市普迅電力信息技術有限公司;國網信息通信產業集團有限公司 |
| 主分類號: | G06Q10/06 | 分類號: | G06Q10/06;G06Q10/04;G06Q10/00;G06Q50/06;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 天津市鼎拓知識產權代理有限公司 12233 | 代理人: | 劉雪娜 |
| 地址: | 300384 天津市濱海新區華苑產*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 綜合 能源 系統 運行 事故 分析 數據 分類 方法 | ||
1.一種綜合能源系統運行事故原因分析的數據集分類方法,其特征在于:包括以下步驟:
步驟1:獲取綜合能源系統運行事故原因數據集,篩選出字符超過300的長數據集;
步驟2:對所述長數據集進行多維預處理,得到預處理后的長數據集;
步驟3:建立經典BOW模型,并針對所述步驟2得到的長數據集進行訓練,獲得所述長數據集的特征列表,通過梯度增強分類器對所述特征列表訓練,獲得梯度提升分類器識別的特征重要性,對所述特征重要性從最高值開始進行排序,得到具有N個重要特征的令牌特征列表ST;
步驟4:從所述步驟2得到的所述長數據集選擇任意兩部分數據作為part1和part2,將part1存儲為新數據集Set_new的開頭,將part2存儲為新數據集Set_new的末尾,且,part1+part2 ? 1,并從所述長數據集中刪除所述兩部分數據,且使原始得所述長數據集中的剩余部分在原始的長數據集中保持80%比例;
步驟5:通過迭代判別的方式識別出part3中的重要特征,并入到所述新數據集Set_new中;
步驟6:設定所述新數據集Set_new字符數為300,重復所述步驟5,直至填滿所述新數據集Set_new;
步驟7:重復所述步驟1-6,對所有的長數據集進行處理,采用卷積神經網絡對所述步驟6最終得到的新的數據集以及步驟1中未被篩選出的短數據集進行分類;
其中,所述步驟5具體包括: 迭代所述步驟3中的令牌特征列表ST,從先前確定為第一個重要的標記開始,在原始數據集中搜索此標記,如果沒有找到,則選擇下一個重要的特征,并再次搜索;如果所選標記存在于原始數據集中,選擇此標記其前后的標記鄰居,將此標記以及標記鄰居添加到所述新的數據集Set_new;
新的數據集Set_new或者所述短數據集轉換成詞向量矩陣;
所述步驟7具體包括以下子步驟:
步驟7.1:將所述步驟6得到的新的數據集Set_new或者所述短數據集轉換成詞向量矩陣,如果詞的數量是n,詞向量的維數是k,那么這個矩陣的大小是n×k;
步驟7.2:將所述詞向量矩陣作為所述卷積神經網絡模型的輸入端,用于提取數據特征;
步驟7.3:通過所述卷積神經網絡模型對步驟7.2提取的特征進行特征融合操作;
步驟7.4:通過softmax分類器計算每個類別下的數據集概率,得到最終的分類結果。
2.根據權利要求1所述的綜合能源系統運行事故原因分析的數據集分類方法,其特征在于:所述步驟2中的多維預處理包括:(1)、對所述數據集進行標準化處理,刪除標點符號、特殊符號和無意義的常用詞,去除數據集中空缺值、數據異常值和重復值;(2)、對所述數據集進行簡化,通過數據規范方法進行簡化,包括維度規范和數值規范,所述維度規范通過主成分分析和相關分析來減少變量以獲得原始數據的簡化或壓縮表示;(3)、對所述數據集中的異常數據進行判斷并剔除出所述數據集,經過數據集標準化和數據集簡化后,再采用異常值診斷技術查找和剔除異常值數據。
3.根據權利要求2 所述的綜合能源系統運行事故原因分析的數據集分類方法,其特征在于:所述去除數據集中空缺值、數據異常值和重復值具體包括:根據原始數據的特點,在原始數據中尋找缺失值,消除或補充缺失值,對于一些不重要的空缺值,采用相鄰數據填充的方法進行補充,過濾掉無法分類的數據;制定規則來消除或替換不合理和錯誤的數據;對不同數據樣本的不同字段進行比較,剔除重復數據。
4.根據權利要求1 所述的綜合能源系統運行事故原因分析的數據集分類方法,其特征在于:所述步驟7.3具體包括:通過模型中的卷積層獲得多個特征圖譜,然后通過池化層進行特征壓縮,簡化網絡計算的復雜度,提取出主要特征,最后通過拼接層和輸出層輸出所述卷積神經網絡模型獲得得到多個不同類別的數據集。
5.根據權利要求4所述的綜合能源系統運行事故原因分析的數據集分類方法,其特征在于:所述池化層為選擇 max pooling函數以獲得最重要的特征。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津市普迅電力信息技術有限公司;國網信息通信產業集團有限公司,未經天津市普迅電力信息技術有限公司;國網信息通信產業集團有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210540826.1/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種超支化固體聚羧酸減水劑的制備方法
- 下一篇:服務器檢測系統自動下料裝置
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





