日韩在线一区二区三区,日本午夜一区二区三区,国产伦精品一区二区三区四区视频,欧美日韩在线观看视频一区二区三区 ,一区二区视频在线,国产精品18久久久久久首页狼,日本天堂在线观看视频,综合av一区

[發明專利]一種大數據資產質量評估方法有效

專利信息
申請號: 201910366031.1 申請日: 2019-04-30
公開(公告)號: CN110070304B 公開(公告)日: 2023-06-27
發明(設計)人: 楊忠勛 申請(專利權)人: 深圳市乾數科技有限公司
主分類號: G06Q10/0639 分類號: G06Q10/0639
代理公司: 深圳市中科創為專利代理有限公司 44384 代理人: 彭西洋
地址: 518000 廣東省深圳市南山區西麗*** 國省代碼: 廣東;44
權利要求書: 查看更多 說明書: 查看更多
摘要:
搜索關鍵詞: 一種 數據 資產 質量 評估 方法
【權利要求書】:

1.一種大數據資產質量評估方法,其特征在于,包括以下步驟:

步驟S1:數據場景劃分,根據行業的業務特點或通用規則,將大數據劃分成若干個數據場景,記為CaseSetBL={C1,C2,C3…CN},N表示數據場景總數;

步驟S2:場景信息因子定義,定義各數據場景的信息因子,記為CaseFactorSet={θ123…θN},所述場景信息因子設置為數據場景在業務運行過程中發生概率及獲取難度的綜合系數;

步驟S3:數據基線配置定義,包括:定義數據源基線配置和定義數據性能基線配置;

步驟S4:數據有效指數計算:計算各數據場景有效數據規模及有效數據比例系數,通過有效數據比例系數和場景信息因子加權計算數據有效指數,

步驟S4具體包括:

a、數據樣本劃分:根據業務特點定義數據樣本的規格,根據數據樣本的規格,將各數據場景分別劃分為若干個數據樣本,總樣本數記為K;

b、數據源基礎配置評估:對于每個數據樣本i,處理如下:

根據數據樣本所包含的數據源集合DataItemSet和數據源基礎配置DataItemSetBL計算數據源基礎因子

如果則

否則:

其中,δ為數據源配置門限,取值0到1之間;

c、數據性能基礎配置評估

對于每個數據樣本,處理如下:

先根據DataPerfSetBL(d),d=1,2…D,判斷每個基礎數據源是否滿足數據性能基礎配置,得到計算第d個基礎數據源滿足性能基礎配置要求的個數,記為Xd

計算所有基礎數據源滿足數據性能基礎配置要求的總個數:

計算所有基礎數據源的性能配置要求總數:

計算數據性能基礎因子(Base?Data?Performance?Factor):

如果

否則

其中,

ρ為數據基礎性能因子門限,取值0到1之間的效數;1.2為基礎數據性能因子門限最大保護值,可配置;

判斷每個性能相對基礎性能的滿足程度高低:

若中的某條性能要求與實際性能不一致,在的基礎上再乘以對應的性能補償系數μ:

μ的取值范圍在(0,2.0),2.0為補償系數的最大保護值,可配置;

每條性能的補償系數μ取決于該條數據性能對業務的重要程度高低;

d、樣本場景分類:

對于滿足數據源基礎配置和數據性能基礎配置的每個數據樣本,根據數據場景劃分,采用機器學習的方法進行場景歸類,得到每種場景下的數據樣本集合;假設在場景分類后,每個子場景的樣本個數為{K1,K2…KN},而對于無法分類的樣本,不做為數據質量評估的樣本;

e、子場景數據源和數據性能修正:

對每個場景分類后的樣本,按照子場景數據源配置進一步評估,得到則子場景數據源修正后的數據源因子為:

對每個場景分類后的樣本,按照子場景數據性能配置進一步評估,得到則子場景數據性能修正后的數據性能因子為:

f、數據有效規模估計:

計算每個子場景的有效數據規模:

首先初始化每個場景的數據有效規模:

Vn=0,n=,1,2...N

對于每個樣本i,如果它屬于子場景n,則:

Vn=Vn+DSFi*DPFi

g:數據有效指數估計:

對于待評估數據的所有數據場景,根據有效數據規模和數據場景信息因子,綜合計算出數據有效指數VI(Validity?Index):

首先,判斷子場景數據是否納入數據有效指數估計:

如果Vn小于門限ThdVI,則:

子場景n不納入數據有效指數計算,將Vn置為0;

其中:

門限ThdVI取絕對值門限,或取相對值門限:

對于絕對值門限:

將ThdVI設置為若干條有效數據規模;

對于相對門限:

設置為各子場景有效數據規模最大值的一定比例:

ThdVI=σ*max(V1,V2…VN)

σ表示可配置門限比例系數,取值為0到1之間的小數;

然后,計算參與計算的子場景有效數據比例系數γn

最后,將各子場景有效數據規模和數據場景信息因子加權得到有效數據指數:

θn為第n個子場景的數據場景信息因子;

步驟S5:數據多樣性指數計算:通過有效數據比例系數計算數據多樣性指數;

步驟S5中,數據多樣性指數記為DI(Diversity?Index):

根據各場景有效數據比例系數γn,通過線性運算計算數據多樣性指數DI:

或者采用其他非線性計算方法:

DI=z(γ12…γN);

步驟S6:數據質量指數計算:將所述數據有效指數和數據多樣性指數進行綜合計算得到數據質量指數。

下載完整專利技術內容需要扣除積分,VIP會員可以免費下載。

該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳市乾數科技有限公司,未經深圳市乾數科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服

本文鏈接:http://www.szxzyx.cn/pat/books/201910366031.1/1.html,轉載請聲明來源鉆瓜專利網。

×

專利文獻下載

說明:

1、專利原文基于中國國家知識產權局專利說明書;

2、支持發明專利 、實用新型專利、外觀設計專利(升級中);

3、專利數據每周兩次同步更新,支持Adobe PDF格式;

4、內容包括專利技術的結構示意圖流程工藝圖技術構造圖

5、已全新升級為極速版,下載速度顯著提升!歡迎使用!

請您登陸后,進行下載,點擊【登陸】 【注冊】

關于我們 尋求報道 投稿須知 廣告合作 版權聲明 網站地圖 友情鏈接 企業標識 聯系我們

鉆瓜專利網在線咨詢

周一至周五 9:00-18:00

咨詢在線客服咨詢在線客服
tel code back_top
主站蜘蛛池模板: 午夜精品一区二区三区三上悠亚 | 国产精品久久久久久久久久久新郎| 国产精品1区二区| 日韩精品一区二区中文字幕| 国产美女视频一区二区三区| 国产精品三级久久久久久电影| 亚洲欧美制服丝腿| 麻豆视频免费播放| 国产一级大片| 欧美网站一区二区三区| 国产精品69久久久| 99久久免费精品国产免费高清| 国产欧美日韩精品在线| 久久国产精品精品国产| 久久国产免费视频| 午夜爽爽视频| 国产在线不卡一区| 99国产超薄丝袜足j在线观看| 91精品综合| 国产精品一区在线播放| 欧美精品免费看| 欧美日韩中文不卡| 亚洲欧洲日本在线观看| 午夜av男人的天堂| 中文字幕日韩有码| 538国产精品| 国产精品一二三区视频出来一| 玖玖国产精品视频| 91丝袜国产在线观看| 日韩欧美精品一区二区| 国产麻豆精品久久| 日本高清一二三区| 蜜臀久久99精品久久一区二区| 精品久久久久久中文字幕| 国产午夜亚洲精品羞羞网站| 高清欧美xxxx| 日韩午夜电影院| 一区二区三区欧美视频| 黄色香港三级三级三级| 精品视频久| 国产一级不卡视频| 国产一区二区在| 午夜叫声理论片人人影院| 欧美乱偷一区二区三区在线| 国产69精品久久久久久久久久| 香蕉免费一区二区三区在线观看| 国产精品99久久久久久宅男| 国产一区二区a| 小萝莉av| 欧美一区二区色| 日韩精品一区二区不卡| 欧美精品一级二级| 黄色香港三级三级三级| 国产精品1234区| 国产日韩精品一区二区三区| 玖玖玖国产精品| 国产一区二区91| 亚洲欧美日韩在线看| 国产精品视频免费看人鲁| 国产乱码一区二区| 久久国产激情视频| 热久久一区二区| 国产精品综合在线| 欧洲在线一区| 国产免费一区二区三区四区| 亚洲国产精品二区| 夜夜夜夜曰天天天天拍国产 | 日本美女视频一区二区| 综合久久一区| 午夜精品影视| 国产一级二级在线| 国产精品伦一区二区三区在线观看| 精品国产区| 色噜噜狠狠色综合影视| 狠狠色噜噜狼狼狼色综合久| 久久免费视频一区| 夜夜爱av| 国产无遮挡又黄又爽又色视频 | 韩日av一区二区| 九九国产精品视频| 国产一区二区三区在线电影| 国产99久久九九精品|