[發明專利]一種數據價值評估系統及方法在審
| 申請號: | 201810834249.0 | 申請日: | 2018-07-26 |
| 公開(公告)號: | CN110766429A | 公開(公告)日: | 2020-02-07 |
| 發明(設計)人: | 李然輝;吳燕飛;阮亞芬;夏珺崢 | 申請(專利權)人: | 國信優易數據有限公司 |
| 主分類號: | G06Q30/02 | 分類號: | G06Q30/02 |
| 代理公司: | 11371 北京超凡志成知識產權代理事務所(普通合伙) | 代理人: | 吳迪 |
| 地址: | 100070 北京市豐臺*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 價值評估 數據集 重置 價值評估系統 數據獲取模塊 數據包含 準確評估 綜合考慮 申請 收益 | ||
1.一種數據價值評估系統,其特征在于,包括:
數據獲取模塊,用于獲取企業提供的數據包含的至少一個數據集的重置成本、以及確定該至少一個數據集的數據價值影響值;
價值評估模塊,用于根據該至少一個數據集的重置成本和數據價值影響值,確定所述數據的價值評估值。
2.根據權利要求1所述的系統,其特征在于,所述數據獲取模塊包括重置成本獲取單元;
所述重置成本獲取單元用于:
針對所述至少一個數據集中的每個數據集,獲取生成該數據集的直接成本、間接成本以及其他成本;
基于獲取的所述直接成本、所述間接成本以及所述其他成本,確定該數據集的重置成本。
3.根據權利要求1所述的系統,其特征在于,所述數據價值影響值包括數據一致性影響值,所述數據獲取模塊包括數據一致性確定單元;所述數據一致性確定單元包括:
數據一致性獲取子單元,用于針對所述至少一個數據集中的每個數據集,獲取該數據集所包含的數據內容和該數據集對應的描述信息;
數據一致性確定子單元,用于確定所述數據內容與所述描述信息中對應描述的一致性程度;并基于所述一致性程度確定該數據集的數據一致性影響值,且所述一致性程度越高,該數據集的數據一致性影響值越高。
4.根據權利要求3所述的系統,其特征在于,所述數據一致性獲取子單元,具體用于針對每個數據集,確定該數據集對應數據文件的第一數據文件大小、以及該數據集對應的描述信息中描述的該數據集對應數據文件的第二數據文件大小;和/或,該數據集的第一數據量大小、以及所述描述信息中描述的該數據集對應的第二數據量大小;和/或,該數據集所包含數據的第一數據類型、以及所述描述信息中描述的該數據集的第二數據類型;
數據一致性確定子單元,具體用于基于如下一種或多種一致性確定該數據集的數據一致性影響值:
所述第一數據文件大小和所述第二數據文件大小之間的一致性;
所述第一數據量大小和所述第二數據量大小之間的一致性;
所述第一數據類型和所述第二數據類型之間的一致性;
且滿足:上述任一種一致性越高,該數據集的數據一致性影響值越高。
5.根據權利要求1所述的系統,其特征在于,所述數據價值影響值包括數據完整性影響值,所述數據獲取模塊包括數據完整性確定單元;所述數據完整性確定單元包括:
數據項統計子單元,用于針對所述至少一個數據集中的每個數據集,統計該數據集中非空的數據項的個數;
數據完整性確定子單元,用于基于統計的數據項的非空占比,確定該數據集的數據完整性影響值,并且滿足:所述非空占比越高,該數據集的數據完整性影響值越高。
6.根據權利要求1所述的系統,其特征在于,所述數據價值影響值包括數據冗余度影響值,所述數據獲取模塊包括數據冗余度確定單元;所述數據冗余度確定單元包括:
數據條目統計子單元,用于針對所述至少一個數據集中的每個數據集,統計該數據集數據條目中的重復條目數;
數據冗余度確定子單元,用于基于該數據集所包含的重復條目占比,確定該數據集的數據冗余度影響值,并且滿足:統計的重復條目越少,該數據集的數據冗余度影響值越高。
7.根據權利要求1所述的系統,其特征在于,所述數據價值影響值包括數據時效性影響值,所述數據獲取模塊包括數據時效性確定單元;所述數據時效性確定單元包括:
數據時間確定子單元,用于針對所述至少一個數據集中的每個數據集,確定該數據集的終止記錄時間、起始記錄時間和當前評估時間;
數據時效性確定子單元,用于基于確定的所述終止記錄時間和所述起始記錄時間之間所跨越的時間區間,以及所述起始記錄時間和所述當前評估時間之間的時間差,確定該數據集的數據時效性影響值,并且滿足:所述時間區間跨度越大,該數據集的數據時效性影響值越高;以及所述時間差越小,該數據集的數據時效性影響值越高。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于國信優易數據有限公司,未經國信優易數據有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810834249.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種數據價值評估系統以及方法
- 下一篇:基于機器學習算法的資源分配方法





