[發明專利]一種基于大數據深度學習的電價稽查執行方法有效
| 申請號: | 201811207293.5 | 申請日: | 2018-10-17 |
| 公開(公告)號: | CN109543943B | 公開(公告)日: | 2023-07-25 |
| 發明(設計)人: | 高曦瑩;葉寧;張冶;關艷;蔡穎凱;回茜;宋曉文;楊飛龍;高勝宇;張雯舒;曹世龍;王一哲;姜輝;孫殿家;田浩杰;王浩淼;崔新廷;王英新;宋錦春 | 申請(專利權)人: | 國網遼寧省電力有限公司電力科學研究院;國家電網有限公司 |
| 主分類號: | G06Q10/0639 | 分類號: | G06Q10/0639;G06Q30/0201;G06Q50/06;G06N3/0464;G06N3/084;G06F18/2433 |
| 代理公司: | 遼寧沈陽國興知識產權代理有限公司 21100 | 代理人: | 何學軍;侯景明 |
| 地址: | 110006 遼寧*** | 國省代碼: | 遼寧;21 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 數據 深度 學習 電價 稽查 執行 方法 | ||
1.一種基于大數據深度學習的電價稽查執行方法,其特征是:包括以下步驟:
步驟1.用電數據獲取并進行簡單分類;包括:(1)獲取數據:數據取自供電企業市場營銷及營銷稽查監控業務數據庫,數據類型對應數值化包括:異常種類:包含客戶基本用電信息,具體包含售電均價波動、特殊電價執行異常、超容量用電、居民大電量、農排大電量、化肥大電量、力率執行異常、變損電量異常、兩部制電價執行異常及分時電價執行異常;對應數值種類從1到N;客戶用電一般屬性:包含客戶基本用電信息;具體包含電壓、電流、變壓器容量、平均功率因數、平均負載率、超容率、總電費、基本電費、峰時電費、平時電費及谷時電費,數值按照歸一化處理便于計算;客戶用電高級屬性:包含用電計算指標及衍生指標;具體包含用電同比、環比、偏差率、峰總比、平總比、谷總比、峰谷比及數值大部分為比值,直接代入矩陣;客戶數據屬性:包含客戶數據是否完整及不完整情況;具體包含用戶類別、所屬行業、所屬位置、抄表號段、售電均價、上月售電均價、上年同期售電均價、售電環比同比及景氣指數,數值分類數值化;(2)簡單分類:將系統中采集的數據按照正常數據集和異常數據集分類導入算法模型,異常數據集樣本數量較少,但足可以對模型進行半監督學習訓練;將樣本中的文字信息轉化為數字信息,并將包含四類數據類型的數據形成正常數據集X、異常數據集x;
上式中:M、N、m、n代表的是維度;
步驟2.用電數據提取概率特征,為每一個樣本構造專屬正態分布,然后采樣重構,并訓練編碼器及解碼器;所述用電數據提取概率特征,包括:判別模型通過變分自動編碼器模型得以實現,變分自動編碼器由編碼器、解碼器及額外損失三部分構成;每一個樣本數據經過編碼器通過均值和方差分布降維生成隱藏變量z,通過解碼器還原樣本增維;通過KL散度衡量額外損失L;通過重建概率生成可有效判別電價執行異常客戶;步驟如下:確定網絡的結構,總共具有q+2層,輸入層和輸出層各占1層,q為隱藏層的層數;導入正常數據集X,確定到模型的超參數,訓練有向圖模型參數θ、φ;初始化編碼器網絡,網絡的作用是將數據集中樣本映射到隱藏分布參數z中,接受輸入,通過非線性激活函數的密集Dense函數連接并發送;然后將輸入數據轉換成隱藏空間的兩個變量,使用密集Dense函數連接的隱藏變量z,其均值和方差分別表示為μz(i)和σz(i);使用異常數據集數據通過神經網絡均值μz(i)和方差σz(i)計算模塊反向傳播訓練編碼器fθ(z|x(i));表達式為:
μz(i),σz(i)=fθ(z|x(i))????????(1);
解碼器是將z作為輸入量,并將參數輸出到數據概率分布中;使用μz(i)和σz(i),通過定義采樣函數從隱藏正態分布中隨機采樣類似點;
每一個異常樣本形成的正態分布進行采樣得到z并引入額外損失變量L,并可通過正向訓練形成解碼器i、l為正反向迭代次數;表達式是為:
上式中:X表示正常數據集,Z表示重構矢量;由生成樣本的均值和方差構建重構概率表達式為:
上述兩個公式中:log?pθ(x(i))為數據集點的邊緣似然值;qφ(z|x(i))為潛變量z的近似后驗值,pθ(z)為潛變量z的先驗分布值;KL為散度,計算獨立分量X正態分布與標準正態分布KL散度作為L值;D表示方差,E表示均值,L(θ,φ;x(i))為損失函數表達式;
公式(3)為該算法的核心公式,表示的是第i次的重構概率,重構概率是平均概率;
為新生成的具有一定均值方差樣本點與異常樣本集的似然概率;L為損失函數;公式(3)是關鍵值重構概率的生成公式;
公式(4)為變分自編碼器的關鍵公式,作用是通過后驗分布qφ(z|x(i))和似然概率pθ(x|z)求出重構x;DKL為代表了近似后驗和先驗潛變量z之間的KL散度,該項類似于正則化,迫使后驗分布與先驗分布趨同;公式(3)中的重構概率正是項的蒙特卡洛估計值;
步驟3.重構概率判別,利用重構概率蒙特卡洛估計值,實現異常客戶判別,實現電價執行稽查工作;所述重構概率判別,包括:利用重構概率蒙特卡洛估計值,實現異常客戶判別,實現電價執行稽查工作;具體包括:從電網營銷系統和稽查監控系統中調取歷史數據作為訓練數據,該數據包含已核對過的正常用戶和異常用戶;為了加快訓練速度,提高了數據集中故障數據的比例;然后用正常數據和異常數據對算法模型進行訓練,訓練自動編碼器和解碼器;訓練后,從電網營銷系統和稽查系統中導入近期某區域的未核對數據集作為測試數據,將測試數據加載模型,通過重構概率和門檻值找出可能的異常用戶,再對異常用戶進行現場核對,從而對算法性能進行分析;采用蒙特卡洛梯度下降法生成了重構概率通過該概率與不同異常種類門限閾值概率α進行比較,確定異常用戶;采用的是變分自動編碼器算法Variational?autoencoder?based?anomaly?detection?algorithm對異常電價執行客戶進行判別;基于大數據深度學習的電價稽查執行方法,數據的獲取出自Hadoop分布式架構硬件服務器系統,通過營銷系統SQL語言提取數據庫數據。
2.根據權利要求1所述的一種基于大數據深度學習的電價稽查執行方法,其特征是:所述變分自動編碼器的流程如下:
輸入標準數據集X,異常數據集x(i),及門檻值α;然后,通過使用正常數據集X訓練變分編碼器并確定有向圖概率參數φ,θ;確定圖概率參數后,通過異常數據集訓練,并由編碼器產生潛變量z的第i次均值和方差,循環次數從1到N,N為異常數據樣本數;為了確定損失函數L,需要從分布條件為N(μz(i),σz(i))的z潛變量空間中進行采樣;解碼器通過對潛變量z的重構訓練,生成的重構估計樣本并循環訓練;循環次數為l從1到L;如果l大于L說明訓練已全覆蓋,準備由公式(3)生成重構概率,如果重構概率小于α值,則第i的數據x(i)是異常數據,進行系統提示“x(i)異常”;否則是正常值繼續循環,直到所有數據都已被判斷過跳出循環。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國網遼寧省電力有限公司電力科學研究院;國家電網有限公司,未經國網遼寧省電力有限公司電力科學研究院;國家電網有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811207293.5/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





