[發明專利]數據質量檢測方法、裝置、計算機設備和存儲介質在審
| 申請號: | 202010435414.2 | 申請日: | 2020-05-21 |
| 公開(公告)號: | CN111626586A | 公開(公告)日: | 2020-09-04 |
| 發明(設計)人: | 梁衛寧;周鈺書;秦鋮;唐文彬;張劍鋒;趙永國;劉森;黎晚晴;陳玲娜 | 申請(專利權)人: | 廣西電網有限責任公司;南方電網數字電網研究院有限公司 |
| 主分類號: | G06Q10/06 | 分類號: | G06Q10/06;G06Q50/06 |
| 代理公司: | 廣州華進聯合專利商標代理有限公司 44224 | 代理人: | 黃恕 |
| 地址: | 530023 廣西*** | 國省代碼: | 廣西;45 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據 質量 檢測 方法 裝置 計算機 設備 存儲 介質 | ||
1.一種數據質量檢測方法,所述方法包括:
獲取電能業務數據;
根據所述電能業務數據獲取電能業務訓練數據;
對電能業務訓練數據進行時間區段分配算法訓練,獲得電能業務數據質量分析結果;
根據所述電能業務數據質量分析結果,構建時間區段分配算法公式;
根據所述電能業務數據以及所述時間區段分配算法公式,獲取所述電能業務數據對應的數據質量檢測結果。
2.根據權利要求1所述的方法,其特征在于,所述根據所述電能業務數據獲取電能業務訓練數據包括:
根據預設訓練集大小從所述電能業務數據中的截取初始訓練集數據;
對所述初始訓練集數據進行一致性檢查,獲取一致性檢查結果;
根據所述一致性檢查結果對所述初始訓練集數據中的取值異常進行修正;
根據修正后的初始訓練集數據的數據數值,對所述修正后的初始訓練集數據進行離散化處理,獲取電能業務訓練數據。
3.根據權利要求1所述的方法,其特征在于,所述對電能業務訓練數據進行時間區段分配算法訓練,獲得電能業務數據質量分析結果包括:
根據所述電能業務訓練數據獲取正數訓練集以及負數訓練集;
根據所述正數訓練集以及所述負數訓練集,確定候選時間類型;
根據所述候選時間類型與預設時間窗口的對比度,確定電能業務數據質量分析結果。
4.根據權利要求3所述的方法,其特征在于,所述根據所述候選時間類型與預設時間窗口的對比度,確定電能業務數據質量分析結果包括:
獲取所述候選時間類型與預設時間窗口的對比度,并確定使所述候選時間類型對比度最大的預設時間窗口;
根據所述候選時間類型以及使所述候選時間類型對比度最大的預設時間窗口,構建電能業務數據質量分析結果對應數據集。
5.根據權利要求3所述的方法,其特征在于,所述根據所述正數訓練集以及所述負數訓練集,確定候選時間類型包括:
根據所述正數訓練集以及所述負數訓練集構建集合枚舉樹;
根據預設剪枝條件對所述集合枚舉樹進行剪枝,獲取候選時間類型。
6.根據權利要求1所述的方法,其特征在于,所述根據所述電能業務數據以及所述時間區段分配算法公式,獲取所述電能業務數據對應的數據質量檢測結果之后還包括:
根據所述數據質量檢測結果,確定各時間區段的電能業務數據對應的數據質量問題;
獲取所述數據質量問題對應的數據治理方法;
根據所述數據治理方法對各時間區段的電能業務數據進行數據治理。
7.一種數據質量檢測裝置,其特征在于,所述裝置包括:
數據獲取模塊,用于獲取電能業務數據;
數據預處理模塊,用于根據所述電能業務數據獲取電能業務訓練數據;
數據訓練模塊,用于對電能業務訓練數據進行時間區段分配算法訓練,獲得電能業務數據質量分析結果;
公式構建模塊,用于根據所述電能業務數據質量分析結果,構建時間區段分配算法公式;
數據質量檢測模塊,用于根據所述電能業務數據以及所述時間區段分配算法公式,獲取所述電能業務數據對應的數據質量檢測結果。
8.根據權利要求7所述的裝置,其特征在于,所述數據預處理模塊用于:
根據預設訓練集大小從所述電能業務數據中的截取初始訓練集數據;
對所述初始訓練集數據進行一致性檢查,獲取一致性檢查結果;
根據所述一致性檢查結果對所述初始訓練集數據中的取值異常進行修正;
根據修正后的初始訓練集數據的數據數值,對所述修正后的初始訓練集數據進行離散化處理,獲取電能業務訓練數據。
9.一種計算機設備,包括存儲器和處理器,所述存儲器存儲有計算機程序,其特征在于,所述處理器執行所述計算機程序時實現權利要求1至6中任一項所述方法的步驟。
10.一種計算機可讀存儲介質,其上存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現權利要求1至6中任一項所述的方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣西電網有限責任公司;南方電網數字電網研究院有限公司,未經廣西電網有限責任公司;南方電網數字電網研究院有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010435414.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種多光譜成像裝置
- 下一篇:雙饋風機故障穿越的優化滅磁控制方法及系統
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





