[發明專利]數據倉庫質量評價方法、裝置、電子設備及存儲介質在審
| 申請號: | 202210139785.5 | 申請日: | 2022-02-16 |
| 公開(公告)號: | CN114490590A | 公開(公告)日: | 2022-05-13 |
| 發明(設計)人: | 任世民 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F16/21 | 分類號: | G06F16/21;G06F16/242;G06F16/28 |
| 代理公司: | 深圳市賽恩倍吉知識產權代理有限公司 44334 | 代理人: | 陳海云;嚴林 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據倉庫 質量 評價 方法 裝置 電子設備 存儲 介質 | ||
1.一種數據倉庫質量評價方法,其特征在于,所述方法包括:
獲取待評價數據倉庫的目標代碼片段;
對所述目標代碼片段進行解析,得到所述數據倉庫中包含的多個數據表及每個所述數據表所屬的層級;
通過多個預設的指標計算模型基于所述多個數據表及每個所述數據表所屬的層級計算得到多個指標值;
獲取每個所述指標值對應的指標參考評價值,并基于所述指標參考評價值判斷對應的所述指標值是否符合要求,得到多個判斷結果;
根據所述多個判斷結果輸出所述待評價數據倉庫的評價結果。
2.如權利要求1所述的數據倉庫質量評價方法,其特征在于,所述獲取待評價數據倉庫的目標代碼片段包括:
掃描所述待評價數據倉庫在預設狀態下的代碼文件;
將掃描的代碼文件確定為所述目標代碼文件;
將所述目標代碼文件分割為所述目標代碼片段。
3.如權利要求1所述的數據倉庫質量評價方法,其特征在于,所述對所述目標代碼片段進行解析,得到所述數據倉庫中包含的多個數據表及每個所述數據表所屬的層級包括:
根據預設關鍵詞對所述目標代碼片段進行分割,得到多個目標代碼子片段,其中,每個所述目標代碼子片段中只包含一個插入語句和一個查詢語句;
對所述插入語句進行解析,得到一個目標表及所述目標表所屬的第一層級;
對所述查詢語句進行解析,得到多個源表及每個所述源表所屬的第二層級。
4.如權利要求2所述的數據倉庫質量評價方法,其特征在于,所述通過多個預設的指標計算模型基于所述多個數據表及每個所述數據表所屬的層級計算得到多個指標值包括:
獲取所述多個源表的層級中跨層級的目標表的第一數量;
獲取所述目標表的第二數量;
通過預設的第一指標計算模型基于所述第一數量及所述第二數量計算得到第一指標值;
獲取每個所述源表對應的所述目標表的第三數量;
通過預設的第二指標計算模型基于所述第三數量計算得到第二指標值;
獲取每個層級所對應的數據表的第四數量;
通過預設的第三指標計算模型基于所述每個層級所對應的數據表的第四數量計算得到第三指標值。
5.如權利要求1至4中任意一項所述的數據倉庫質量評價方法,其特征在于,所述獲取每個所述指標對應的指標參考評價值包括:
獲取歷史數據倉庫在所述預設狀態下的歷史代碼片段;
對所述歷史代碼片段進行解析,得到所述歷史數據倉庫中包含的多個歷史數據表及每個所述歷史數據表所屬的層級;
通過所述多個預設的指標計算模型基于所述多個歷史數據表及每個所述歷史數據表所屬的層級計算得到多個歷史指標值;
根據所述多個歷史指標值的分布情況及對應的歷史評價結果得到對應的指標參考評價值。
6.如權利要求5所述的數據倉庫質量評價方法,其特征在于,所述根據所述多個歷史指標值的分布情況及對應的歷史評價結果得到對應的指標參考評價值包括:
獲取同一個歷史指標值對應的歷史評價結果中的目標歷史評價結果;
獲取所述目標歷史評價結果對應的目標歷史指標值;
將所述目標歷史指標值中的異常點進行去除;
根據去除異常點的目標歷史指標值得到對應的指標參考評價值。
7.如權利要求1至4中任意一項所述的數據倉庫質量評價方法,其特征在于,所述方法還包括:
獲取所述多個判斷結果中為不符合要求的目標判斷結果;
將所述目標判斷結果進行可視化顯示。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210139785.5/1.html,轉載請聲明來源鉆瓜專利網。





