[發明專利]一種數據處理方法、電子設備及存儲介質在審
| 申請號: | 201811330589.6 | 申請日: | 2018-11-07 |
| 公開(公告)號: | CN109597805A | 公開(公告)日: | 2019-04-09 |
| 發明(設計)人: | 肖涌川;夏鈺;劉俊芳 | 申請(專利權)人: | 平安科技(深圳)有限公司 |
| 主分類號: | G06F16/215 | 分類號: | G06F16/215 |
| 代理公司: | 廣州三環專利商標代理有限公司 44202 | 代理人: | 郝傳鑫;熊永強 |
| 地址: | 518000 廣東省深圳市福田區福*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據處理 目標數據 存儲介質 電子設備 數據評估 原始數據 預處理 數據標準化 預處理規則 數據存儲 無效數據 準確度 評估 申請 | ||
本申請實施例公開了一種數據處理方法、電子設備及存儲介質,涉及數據處理及數據標準化技術,其中方法包括:獲取待處理的原始數據;采用預處理規則對所述原始數據進行預處理,獲得目標數據;評估所述目標數據以獲得數據評估結果;判斷所述數據評估結果是否滿足數據質量要求;若不滿足,將所述目標數據標記為無效數據,便于獲得規范數據以進行后續的數據存儲或者處理過程,可以提高數據處理的效率和準確度。
技術領域
本申請涉及數據處理技術領域,尤其涉及一種數據處理方法、電子設備及計算機存儲介質。
背景技術
大數據已經被廣泛認為是一種戰略性的新型資源,可以定義當今時代產生的海量數據以及相關的技術發展與服務創新。大數據蘊藏著巨大的商業價值。在數據流通領域,隨著數據量迅速增長,不同數據源的數據質量參次不齊,數據質量有不同的概念和標準,數據質量一般包括數據的準確性、完整性、及時性、一致性等定量描述。對于大數據時代下的用戶來說,其所需存儲、處理的數據量大,數據來源和數據結構繁多復雜,為大數據的分析和應用帶來很多挑戰。用戶要想充分發揮大數據所賦予的機遇和優勢,前提是必須擁有可靠、準確、及時的高質量的數據,只有從高質量的大規模數據中提取隱含的、有用的信息,才能做出更加精準、更加符合市場和客戶需求的決策。為此,用戶更加注重數據質量及其重要性。
在醫療保健領域,在各方面都需要處理大量的醫保數據,因此數據處理依然需要在保證準確性的前提下,提高處理效率。一般而言,可以通過采集接收的數據或者購買的數據進行數據比對分析和處理,實現獲取有效信息的目的,但數據本身可能存在一定的誤差,其數據類型等可能差異較大,因此在數據處理和分析的過程中不能準確有效地獲得分析結果,以及會導致系統出現誤差甚至錯誤,數據處理的準確率和處理效率較低。
發明內容
本申請實施例提供一種數據處理方法、電子設備及存儲介質,便于獲得規范數據以進行后續的數據存儲或者處理過程,可以提高數據處理的效率和準確度。
第一方面,本申請實施例提供了一種數據處理方法,該方法包括:
獲取待處理的原始數據;采用預處理規則對所述原始數據進行預處理,獲得目標數據;
評估所述目標數據以獲得數據評估結果;
判斷所述數據評估結果是否滿足數據質量要求;
若不滿足,將所述目標數據標記為無效數據。
作為一種可能的實施方式,所述判斷所述數據評估結果是否滿足數據質量要求之后,所述方法還包括:
將所述數據評估結果滿足所述數據質量要求的目標數據標記為有效數據,并將所述有效數據存儲于存儲空間。
作為一種可能的實施方式,所述采用預處理規則對所述原始數據進行預處理,獲得目標數據包括:
按照脫敏規則對所述原始數據進行脫敏處理,獲得滿足所述脫敏規則的目標數據。
作為一種可能的實施方式,所述采用預處理規則對所述原始數據進行預處理,獲得目標數據還包括:
按照目標數據結構對所述原始數據進行數據轉碼,獲得與所述目標數據結構匹配的目標數據。
作為一種可能的實施方式,所述評估所述目標數據以獲得數據評估結果之前,所述方法還包括:
確定所述目標數據的目標類型,獲取所述目標類型對應的排查規則;
所述評估所述目標數據以獲得數據評估結果包括:
按照所述排查規則對所述目標數據進行評估以獲得所述數據評估結果。
作為一種可能的實施方式,所述按照所述排查規則對所述目標數據進行檢測以獲得所述數據評估結果包括:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于平安科技(深圳)有限公司,未經平安科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811330589.6/2.html,轉載請聲明來源鉆瓜專利網。





