[發(fā)明專利]一種基于隨機森林的電力用戶特征識別分類方法在審
| 申請?zhí)枺?/td> | 201711260271.0 | 申請日: | 2017-12-04 |
| 公開(公告)號: | CN108062560A | 公開(公告)日: | 2018-05-22 |
| 發(fā)明(設(shè)計)人: | 談竹奎;王冕;李正佳;馬春雷;徐長寶;吳金勇;鞠遠;劉斌;桂專;袁旭峰;杜雪;汪永祥 | 申請(專利權(quán))人: | 貴州電網(wǎng)有限責任公司電力科學(xué)研究院 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 550002 貴*** | 國省代碼: | 貴州;52 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 隨機 森林 電力 用戶 特征 識別 分類 方法 | ||
1.一種基于隨機森林的電力用戶特征識別分類方法,其特征在于,包括以下步驟:
根據(jù)電力用戶的負荷曲線和具體數(shù)據(jù),分析不同電力用戶用電數(shù)據(jù)特征,提煉出電力用戶用電負荷主要特征;
處理電力用戶負荷數(shù)據(jù),提取出電力用戶負荷數(shù)據(jù)的主要影響因子,以一定比例劃分獲取得到隨機森林的訓(xùn)練集和測試集;
有放回地從訓(xùn)練集中隨機抽取樣本,抽取k個樣本,每個樣本的樣本容量和原始訓(xùn)練集一樣;
利用決策樹算法對k個樣本進行訓(xùn)練,獲得k個決策樹分類模型;
將k個決策樹分類模型組成起來,形成組合分類模型,即隨機森林分類模型,每個決策樹通過投票表決最終分類;
利用測試集對隨機森林模型進行分類結(jié)果測試,將測試結(jié)果和測試集結(jié)果進行比較,以此來驗證隨機森林分類模型;
收集電力用戶負荷特性數(shù)據(jù),利用該模型對這些數(shù)據(jù)進行分類;
輸出電力用戶的分類結(jié)果。
2.根據(jù)權(quán)利要求1所述的基于隨機森林的電力用戶特征識別分類方法,其特征在于,負荷特征值的提取,電力用戶負荷特征有:
①、峰值P
②、峰谷差ΔP
ΔP
③、負荷率k
④、最小負荷系數(shù)α。
⑤、耗電量W
3.根據(jù)權(quán)利要求4所述的基于隨機森林的電力用戶特征識別分類方法,其特征在于,選擇最優(yōu)化分屬性:
“信息熵”是度量樣本集合純度最常用的一種指標,是用來衡量一元模型中信息不確定性的指標,信息的不確定性越大,熵的值也就越大。假的當前樣本集合D中第k類樣本所占的比例為p
Ent(D)的值越小,則D的純度越高。
假定離散屬性a有V個可能的取值{a
一般而言,信息增益越大,則意味著使用屬性a來進行劃分所獲得的“純度提升”越大,因此,我們可用信息增益來進行決策樹的劃分屬性選擇。
“條件熵”是通過獲得更多地信息來消除一元模型中的不確定性,也就是通過二元或者多元模型來降低一元模型的熵。由于只使用一元模型時,只考慮一種事件,這樣可能會造成不確定性太大。在二元模型中,我們通過其他事件聯(lián)合考慮以及不同事件分別考慮的兩種概率來降低不確定性。計算條件熵時使用了兩種概率,分別是結(jié)果與其他所有事件的聯(lián)合概率P(c),以及結(jié)果其他事件分別考慮的條件概率E(c)。條件熵E(T,X)的計算公式如下。條件熵越大,說明二元模型的不確定性越小。
E(T,X)=∑P(c)E(c)
“互信息”是用來衡量信息之間相關(guān)性的指標。當這兩個信息完全相關(guān)時,互信息為1,不相關(guān)時,互信息為0,。具體的計算方法就是熵和條件熵之間的差。以下為公式
Gain(T,X)=Entropy(T)-Entropy(T,X)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于貴州電網(wǎng)有限責任公司電力科學(xué)研究院,未經(jīng)貴州電網(wǎng)有限責任公司電力科學(xué)研究院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711260271.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標記或含有代碼標記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 電力控制器、電力生成系統(tǒng)以及電力控制器的控制方法
- 電力供給裝置、電力接收裝置和包括電力接收裝置的車輛以及用于電力供給系統(tǒng)的控制方法
- 電力接收裝置、電力傳送裝置及其控制方法
- 一種智能電力客服系統(tǒng)的構(gòu)建方法及系統(tǒng)
- 無線電力傳輸系統(tǒng)、無線電力發(fā)送裝置和無線電力接收裝置
- 一種電力監(jiān)控平臺數(shù)據(jù)信息映射匹配方法及系統(tǒng)
- 用于電力分配的系統(tǒng)和方法
- 電力傳輸裝置、電力接收裝置和電力傳輸裝置的控制方法
- 一種電力傳輸線圈無線傳輸電力的無線電力傳輸系統(tǒng)
- 一種電力運行數(shù)據(jù)監(jiān)控系統(tǒng)





