[發(fā)明專利]一種基于優(yōu)化的監(jiān)督學(xué)習進行臺區(qū)用戶識別的方法在審
| 申請?zhí)枺?/td> | 201910095251.5 | 申請日: | 2019-01-31 |
| 公開(公告)號: | CN109816033A | 公開(公告)日: | 2019-05-28 |
| 發(fā)明(設(shè)計)人: | 唐明;何仲瀟;王劍;王梟;汪曉華 | 申請(專利權(quán))人: | 清華四川能源互聯(lián)網(wǎng)研究院 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 成都九鼎天元知識產(chǎn)權(quán)代理有限公司 51214 | 代理人: | 陽佑虹 |
| 地址: | 610000 四川省成都市天*** | 國省代碼: | 四川;51 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 臺區(qū) 交叉驗證 用戶識別 測試集 訓(xùn)練集 驗證集 監(jiān)督 學(xué)習 低壓臺區(qū) 電壓數(shù)據(jù) 合理設(shè)置 數(shù)據(jù)分析 拓撲關(guān)系 用戶歸屬 用戶數(shù)據(jù) 跨臺區(qū) 有效地 優(yōu)化 搶修 標簽 分類 轉(zhuǎn)換 規(guī)劃 維護 | ||
1.一種基于優(yōu)化的監(jiān)督學(xué)習進行臺區(qū)用戶識別的方法,其特征在于,包括以下步驟:
步驟S1,獲取臺區(qū)變壓器低壓側(cè)電壓數(shù)據(jù)及待識別的用戶電表電壓數(shù)據(jù);
步驟S2,對獲取的電壓數(shù)據(jù)進行預(yù)處理;
步驟S3,確定已知臺戶拓撲關(guān)系的用戶及用戶所屬臺區(qū)和相別,根據(jù)用戶所屬臺區(qū)和相別確定用戶數(shù)據(jù)的對應(yīng)標簽,建立訓(xùn)練集、驗證集和測試集,采用交叉驗證的方式對KNN模型中的k參數(shù)進行確定,并完成模型的訓(xùn)練;
步驟S4,采用已訓(xùn)練好的訓(xùn)練模型和確定的k值對待識別用戶的電壓數(shù)據(jù)進行識別分類,進而實現(xiàn)對待識別用戶電壓數(shù)據(jù)中臺區(qū)用戶的識別,并輸出識別結(jié)果。
2.如權(quán)利要求1所述的基于監(jiān)督學(xué)習的臺區(qū)用戶識別及判別方法,其特征在于,步驟S1中l(wèi)臺臺區(qū)變壓器低壓側(cè)電壓數(shù)據(jù)為其中:表示第n個時刻第f臺變壓器A相的低壓側(cè)電壓;表示第n個時刻第f臺變壓器B相的低壓側(cè)電壓;表示第n個時刻第f臺變壓器A相的低壓側(cè)電壓;而待識別的m臺用戶電表電壓數(shù)據(jù)其中,表示第n個時刻第f臺待識別用戶電表電壓。
3.如權(quán)利要求1所述的基于監(jiān)督學(xué)習的臺區(qū)用戶識別及判別方法,其特征在于,所述步驟S2中當待處理數(shù)據(jù)的維度較大時對數(shù)據(jù)進行降維處理,把多維的數(shù)據(jù)化為少數(shù)主成分進行分析,以提高算法的計算效率;或當數(shù)據(jù)維度較小時不降維直接處理。
4.如權(quán)利要求1所述的基于監(jiān)督學(xué)習的臺區(qū)用戶識別及判別方法,其特征在于,所述步驟S3中采用交叉驗證的方式對KNN模型中的k參數(shù)進行確定,并完成模型的訓(xùn)練具體包括以下步驟:
步驟S3.1,選取一部分已知臺戶關(guān)系的用戶電壓數(shù)據(jù)和對應(yīng)標簽、及變壓器的電壓數(shù)據(jù)和對應(yīng)標簽作為訓(xùn)練集;一部分已知臺戶關(guān)系的用戶電壓數(shù)據(jù)和對應(yīng)標簽作為驗證集;剩余的已知臺戶關(guān)系的用戶電壓數(shù)據(jù)和對應(yīng)標簽作為測試集;
步驟S3.2,在訓(xùn)練集中數(shù)據(jù)和標簽已知的情況下,確定距離度量方式,輸入驗證集的數(shù)據(jù),遍歷所有可能出現(xiàn)的k值,利用優(yōu)化后的KNN模型對驗證集中的用戶電壓數(shù)據(jù)進行分類,評估輸入不同的k值時,對驗證集用戶分類結(jié)果的準確度,并選取準確度最高時的k值作為輸入?yún)?shù);
步驟S3.3,對前一步驟中確定的k值進行判斷,判斷其是否滿足預(yù)定的目標條件,當滿足預(yù)定目標條件時繼續(xù)下一步驟,當不滿足預(yù)定目標條件時返回步驟S3.2、并進一步地利用訓(xùn)練模型對測試集數(shù)據(jù)進行分類,從而進一步確認k值的合理性。
5.如權(quán)利要求4所述的基于監(jiān)督學(xué)習的臺區(qū)用戶識別及判別方法,其特征在于,所述步驟S3.1中訓(xùn)練集、驗證集和測試集的數(shù)據(jù)占總數(shù)據(jù)的比例分別為80%、10%和10%。
6.如權(quán)利要求4或5所述的基于監(jiān)督學(xué)習的臺區(qū)用戶識別及判別方法,其特征在于,所述利用優(yōu)化后的KNN模型對驗證集中的用戶電壓數(shù)據(jù)進行分類具體為:
S3.2.1,計算驗證數(shù)據(jù)與各個訓(xùn)練數(shù)據(jù)之間的距離,并確定距離度量方式;
S3.2.2,按照距離值的遞增關(guān)系對訓(xùn)練數(shù)據(jù)進行排序;
S3.2.3,選取訓(xùn)練數(shù)據(jù)中距離值最小的前k個點;
S3.2.4,統(tǒng)計并確定前k個點所屬類別的出現(xiàn)頻率;
S3.2.5,返回前k個點中出現(xiàn)頻率最高的分類類別作為此次驗證數(shù)據(jù)的預(yù)測分類。
7.如權(quán)利要求6所述的基于監(jiān)督學(xué)習的臺區(qū)用戶識別及判別方法,其特征在于,所述距離度量方式采用相關(guān)系數(shù)、余弦相似度、歐式距離中的一種。
8.如權(quán)利要求7所述的基于監(jiān)督學(xué)習的臺區(qū)用戶識別及判別方法,其特征在于,所述距離度量方式的定義如下:
所述距離Lpq采用余弦相似度來定義時,
式中,zp′為行向量zp的轉(zhuǎn)置。zq′為行向量zq的轉(zhuǎn)置。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于清華四川能源互聯(lián)網(wǎng)研究院,未經(jīng)清華四川能源互聯(lián)網(wǎng)研究院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910095251.5/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識別印刷或書寫字符或者用于識別圖形,例如,指紋的方法或裝置
G06K9-03 .錯誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標記或含有代碼標記的打印字符的,例如,由不同形狀的各個筆畫組成的,而且每個筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合





