[發(fā)明專利]數(shù)據(jù)降維方法、裝置、計算機設備和存儲介質在審
| 申請?zhí)枺?/td> | 202210363550.4 | 申請日: | 2022-04-08 |
| 公開(公告)號: | CN114840506A | 公開(公告)日: | 2022-08-02 |
| 發(fā)明(設計)人: | 喬穎;魯宗相;孫書鑫;王楠;袁帥;程艷 | 申請(專利權)人: | 清華大學;國網(wǎng)山東省電力公司電力科學研究院 |
| 主分類號: | G06F16/215 | 分類號: | G06F16/215;G06F16/28;G06F17/16;G06N3/04;G06N3/08 |
| 代理公司: | 北京華進京聯(lián)知識產權代理有限公司 11606 | 代理人: | 馬云超 |
| 地址: | 10008*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數(shù)據(jù) 方法 裝置 計算機 設備 存儲 介質 | ||
本申請涉及一種數(shù)據(jù)降維方法、裝置、計算機設備、存儲介質和計算機程序產品。所述方法包括:獲取風電功率的多種影響因素以及影響因素數(shù)據(jù);根據(jù)所述目標季節(jié)的影響因素數(shù)據(jù),對所述多種影響因素進行多重共線性診斷,在多種影響因素之間存在多重共線性,則根據(jù)所述目標季節(jié)的影響因素數(shù)據(jù)、預設影響因素觀測數(shù)據(jù)以及嶺參數(shù),計算各所述影響因素的嶺回歸系數(shù);根據(jù)所述嶺回歸系數(shù)與所述嶺參數(shù)之間的對應關系對各個影響因素進行篩選,剔除所述嶺回歸系數(shù)不滿足預設嶺回歸系數(shù)變化條件的影響因素,得到多個目標影響因素。通過采用本方法,可以通過各個影響因素的嶺回歸系數(shù)對多個影響因素進行篩選,在保證數(shù)據(jù)應用價值的條件下,降低數(shù)據(jù)冗余性。
技術領域
本申請涉及電力系統(tǒng)技術領域,特別是涉及一種數(shù)據(jù)降維方法、裝置、計算機設備、存儲介質和計算機程序產品。
背景技術
隨著人們對于電力能源的低碳化提出了更高的要求,以風力和光伏為主的可再生能源逐漸替代化石能源,在發(fā)電領域中占據(jù)了越來越大的比例。風力發(fā)電作為應用最廣泛的新能源,具有典型的隨機性和不可預測性,加大了制定合理的電力規(guī)劃方案的難度。如何在這種不可預測的自然條件下,必要盡可能準確地計算新能源的發(fā)電能力是亟待解決的問題。
當前電網(wǎng)中存在海量的數(shù)據(jù)可以用來分析和挖掘風力發(fā)電的特性,由于測風塔采集到的不同種類的影響因素之間往往存在著線性或非線性的關系,因此存在冗余的影響因素,這些冗余數(shù)據(jù)不僅增加了建模的復雜度,甚至會導致相關模型的不準確。為了更好地挖掘數(shù)值天氣預報的數(shù)據(jù)價值,需要對數(shù)據(jù)冗余問題進行研究,采用有效的方法對于數(shù)據(jù)進行篩選與降維,降低數(shù)據(jù)冗余性,提升數(shù)據(jù)的應用價值。
傳統(tǒng)技術中的降維方法可以分為線性降維方法和非線性降維方法,其中線性降維的代表算法有主成分分析(PCA)和線性判別分析(LDA)等,線性方法將原始數(shù)據(jù)集嵌入線性結構中,模型計算簡單,對于線性和高斯分布的數(shù)據(jù)效果良好。然而,當實際數(shù)據(jù)出現(xiàn)明顯非線性結構的時候,降維效果明顯欠佳。常用的非線性降維方法中,核主成分分析法(KPCA)中最關鍵的核選取困難,目前只能依托經(jīng)驗判斷,而t-分布鄰域嵌入(t-SNE)算法計算復雜度高,且只能降維至2維或者3維,對于風電預測可能使得數(shù)據(jù)點揉雜在一起無法區(qū)分,降維效果不好。
發(fā)明內容
基于此,有必要針對上述技術問題,提供一種能夠提高數(shù)據(jù)應用價值的數(shù)據(jù)降維方法、裝置、計算機設備、計算機可讀存儲介質和計算機程序產品。
第一方面,本申請?zhí)峁┝艘环N數(shù)據(jù)降維方法。所述方法包括:
獲取風電功率的多種影響因素以及影響因素數(shù)據(jù),所述影響因素數(shù)據(jù)包括多種影響因素在目標季節(jié)內多個時刻的參數(shù)值;
根據(jù)所述目標季節(jié)的影響因素數(shù)據(jù),對所述多種影響因素進行多重共線性診斷,得到每一個影響因素的多重共線性診斷參數(shù);
如果根據(jù)各所述影響因素的多重共線性診斷參數(shù),確定所述多種影響因素之間存在多重共線性,則根據(jù)所述目標季節(jié)的影響因素數(shù)據(jù)、預設影響因素觀測數(shù)據(jù)以及嶺參數(shù),計算各所述影響因素的嶺回歸系數(shù);
根據(jù)所述嶺回歸系數(shù)與所述嶺參數(shù)之間的對應關系對各個影響因素進行篩選,剔除所述嶺回歸系數(shù)不滿足預設嶺回歸系數(shù)變化條件的影響因素,得到多個目標影響因素。
在其中一個實施例中,在所述根據(jù)所述目標季節(jié)的影響因素數(shù)據(jù),對所述多種影響因素進行多重共線性診斷,得到每一個影響因素的多重共線性診斷參數(shù)的步驟之后,所述方法還包括:
根據(jù)每一個影響因素的多重共線性診斷參數(shù),判斷所述多種影響因素之間是否存在多重共線性。
在其中一個實施例中,所述影響因素的多重共線性診斷參數(shù)包括容忍度;
所述根據(jù)所述目標季節(jié)的影響因素數(shù)據(jù),對所述多種影響因素進行多重共線性診斷,得到每一個影響因素的多重共線性診斷參數(shù),包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學;國網(wǎng)山東省電力公司電力科學研究院,未經(jīng)清華大學;國網(wǎng)山東省電力公司電力科學研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210363550.4/2.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結構
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





