[發明專利]一種電網企業關鍵數據分析方法有效
| 申請號: | 201710704564.7 | 申請日: | 2017-08-16 |
| 公開(公告)號: | CN107578149B | 公開(公告)日: | 2020-08-11 |
| 發明(設計)人: | 施永益;王鋒華;夏洪濤;朱國榮;馮昊;葉玲節;陳俊;紀德良;石佳;沈磊 | 申請(專利權)人: | 國網浙江省電力公司經濟技術研究院;國網浙江省電力公司;浙江華云信息科技有限公司;杭州宇維科技有限公司 |
| 主分類號: | G06Q10/06 | 分類號: | G06Q10/06;G06Q50/06 |
| 代理公司: | 浙江翔隆專利事務所(普通合伙) 33206 | 代理人: | 張建青 |
| 地址: | 310008 浙江*** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 電網 企業 關鍵 數據 分析 方法 | ||
本發明公開了一種電網企業關鍵數據分析方法。針對Apriori算法頻繁掃描數據庫的問題,國內外學者在此方面進行了大量的研究工作,但仍存在較多問題。本發明包括建立電網企業運營績效指標檢測體系、基于蒙特卡羅模擬方法設置動態閾值調整和采用改進型Apriori算法量化數據組之間關聯關系;采用改進型Apriori算法量化數據組之間關聯關系的過程包括改進型Apriori算法挖掘頻繁項,即通過改進Apriori算法,挖掘候選集中的頻繁項。本發明可以有效地通過基礎變化數據對企業運營的評價指標數據進行分析,有效提高了計算效率。
技術領域
本發明涉及數據挖掘領域,具體地說是一種基于改進Apriori算法和蒙特卡洛模擬的電網企業關鍵數據分析方法。
背景技術
隨著電力行業的信息化發展,電網企業運營的數據也得到了快速增長,對電力大數據進行研究對電能資源的優化配置,能源效率水平的提升,電網企業運營利潤率的提高有重要意義。電力大數據在電網運營方面的價值在于挖掘運營數據之間的關系和規律,以滿足企業電力生產和經營管理的需要;構建能夠反應企業運行狀況的核心指標和能夠支撐核心指標提升的關聯性指標。數據挖掘作為從大數據中提取有效信息的方法,被越來越多的應用在各行各業,主要指的是發現數據庫中的隱藏信息和潛在模式。作為數據挖掘最重要的分支之一,關聯性算法一般包含兩個方向:1)通過預定義的閾值篩選出頻繁項;2)生成滿足置信度要求的關聯規則。
Apriori算法是挖掘關聯規則的常見重要算法,主要通過預定義數據組之間的最小支持度和最小置信度值,篩選出數據組滿足閾值條件的頻繁項,并根據頻繁項之間的支持度和置信度,對數據組之間的關聯關系進行進一步的量化。雖然經典Apriori算法的表現比不上現有的最新深度優先搜索方法,但是其仍然被認為是最重要的關聯性挖掘算法。因為Apriori算法基本思想是尋找給定數據集中所有頻繁項,這種通用的思想和操作辦法可以應用在任何數據庫中的關聯性挖掘中。而深度優先搜索算法則既受到所構建FP-tree的結構復雜性制約,又受到記錄節點的物理存儲消耗的限制。
近年來也有許多國內外學者在此方面進行了大量的研究工作,針對Apriori算法頻繁掃描數據庫的問題,Park等人提出了直接散列和修建算法(Direct Hashing andPruning)算法,其利用散列(hash)的方法來產生候選集,但是當數據庫中項目集數量較多時,哈希表的生成效率會因計算量而大幅下降。Toivonen通過采樣(sampling)產生候選集,雖然采樣可以有效的實現頻繁項的抽取,但是由于采樣過程的隨機性,很容易造成數據的關聯規則挖掘不完善。Don和Han等人提出BitTableFI算法,具體操作為將數據庫壓縮在BitTable中,因此候選集項的選取和支持度的計算都可以根據BitTable特殊的數據結構快速實現。Bhandari等人將FP-tree方法與Apriori算法相結合,提出了I-Apriori算法,其主要思想是在搜尋候選頻繁項時所掃描減少事物集的數目,以達到節約時間的目的。Zhao等人提出了基于位表的頻繁項挖掘算法BITXOR,通過二進制序列來表示數據項。
發明內容
本發明所要解決的技術問題是克服上述現有技術存在的缺陷,提供一種基于改進Apriori算法和蒙特卡洛模擬的電網企業關鍵數據分析方法,以有效提高計算效率,得出對結果型數據影響較大的數據為目的。
為此,本發明采用如下的技術方案:一種電網企業關鍵數據分析方法,包括建立電網企業運營績效指標檢測體系、基于蒙特卡羅模擬方法設置動態閾值調整和采用改進型Apriori算法量化數據組之間關聯關系;
采用改進型Apriori算法量化數據組之間關聯關系的過程包括改進型Apriori算法挖掘頻繁項,所述的改進型Apriori算法挖掘頻繁項包括以下步驟:
1)僅對數據庫進行一次掃描,對每一個項目得到事物項標識;
2)計算所有項在Lk-1中出現的次數,刪除小于k-1的項,將剩余項保存為候選集Ck;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國網浙江省電力公司經濟技術研究院;國網浙江省電力公司;浙江華云信息科技有限公司;杭州宇維科技有限公司,未經國網浙江省電力公司經濟技術研究院;國網浙江省電力公司;浙江華云信息科技有限公司;杭州宇維科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710704564.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:粉煤加壓輸送裝置及粉煤加壓氣化系統
- 下一篇:料位測量裝置
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





