[發明專利]一種資訊數據質量檢測方法和裝置在審
| 申請號: | 202110264051.5 | 申請日: | 2021-03-10 |
| 公開(公告)號: | CN112990689A | 公開(公告)日: | 2021-06-18 |
| 發明(設計)人: | 王堯堯;蔣俐赟;雷萬保 | 申請(專利權)人: | 華泰證券股份有限公司 |
| 主分類號: | G06Q10/06 | 分類號: | G06Q10/06 |
| 代理公司: | 南京縱橫知識產權代理有限公司 32224 | 代理人: | 董建林 |
| 地址: | 210019 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 資訊 數據 質量 檢測 方法 裝置 | ||
1.一種資訊數據質量檢測方法,其特征在于,包括如下步驟:
基于多個質量維度對資訊數據質量分別進行數據屬性質量分析量化和數據環境質量分析量化,所述質量維度包括資訊數據的準確性、完整性、一致性、有效性和及時性;
根據每個所述質量維度的數據屬性質量分析量化結果和數據環境質量分析量化結果和相對應的權重,采用加權平均計算方式獲得每個質量維度的數據質量;
根據每個質量維度的所述質量相加求得資訊數據的綜合數據質量。
2.根據權利要求1所述的資訊數據質量檢測方法,其特征在于,基于多個質量維度對資訊數據質量進行數據屬性質量分析量化的方法包括如下步驟:
基于資訊數據的業務特性,獲取資訊數據質量檢測的屬性量化指標;
根據所述屬性量化指標,構建評測數據屬性質量的量化指標和權重矩陣。
3.根據權利要求2所述的資訊數據質量檢測方法,其特征在于,基于數據屬性質量的所述量化指標的覆蓋選取情況,每個所述質量維度的數據屬性質量分析量化的數據質量公式表示如下:
式中,wi代表第i個數據數據屬性質量評估指標的權重;ri代表第i個數據數據屬性質量評估指標的權重,覆蓋的取1,否則取0.2;si代表第i個數據屬性質量評估指標的通過率,指標未覆蓋時取默認值0.95;n代表數據屬性質量評估指標的個數;wj代表第j個數據數據屬性質量評估指標的權重;rj代表第j個數據數據屬性質量評估指標的權重,覆蓋的取1,否則取0.2。
4.根據權利要求3所述的資訊數據質量檢測方法,其特征在于,基于多個質量維度對資訊數據質量進行數據環境質量分析量化的方法包括如下步驟:
基于資訊數據的數據環境因素,構建評測數據環境質量的量化模型,所述數據環境因素包括數據發布機構級別、數據發布穩定性、數據獲取容易程度、數據生產難度和數據直接來源服務能力;
采用專家評審法,對所述量化模型中的每個所述數據環境因素進行等級評分量化以及權重分配。
5.根據權利要求4所述的資訊數據質量檢測方法,其特征在于,根據每個質量維度的所述質量相加求得資訊數據的綜合數據質量的計算公式表示如下:
score=subjScore×60%+objScore×40%
式中,score表示最終數據質量,subjScore表示數據環境質量分析量化的數據質量,objScore表示數據屬性質量分析量化的數據質量。
6.根據權利要求5所述的資訊數據質量檢測方法,其特征在于,根據所述綜合數據質量對資訊數據進行質量評測,具體方法包括如下步驟:
所述綜合數據質量大于99時,屬于質量高級數據;
所述綜合數據質量在[97,99]時,屬于質量中高級數據;
所述綜合數據質量在[95,97]時,屬于質量中級數據;
所述綜合數據質量在[90,95]時,屬于質量中低級數據;
所述綜合數據質量小于90時,屬于質量低級數據。
7.一種資訊數據質量檢測裝置,其特征在于,包括如下模塊:
分析模塊,用于基于多個質量維度對資訊數據質量分別進行數據屬性質量分析量化和數據環境質量分析量化,所述質量維度包括資訊數據的準確性、完整性、一致性、有效性和及時性;
量化模塊,用于根據每個所述質量維度的數據屬性質量分析量化結果和數據環境質量分析量化結果和相對應的權重,采用加權平均計算方式獲得每個質量維度的數據質量;
質量檢測模塊,用于根據每個質量維度的所述質量相加求得資訊數據的綜合數據質量。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華泰證券股份有限公司,未經華泰證券股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110264051.5/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:航班保障自動化排班系統
- 下一篇:一種用于治療胃炎、胃潰瘍、胃糜爛的配方
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





