[發明專利]一種提升數據庫數據校驗質量的測試方法在審
| 申請號: | 201911046134.6 | 申請日: | 2019-10-30 |
| 公開(公告)號: | CN111061703A | 公開(公告)日: | 2020-04-24 |
| 發明(設計)人: | 潘磊 | 申請(專利權)人: | 九次方大數據信息集團有限公司 |
| 主分類號: | G06F16/215 | 分類號: | G06F16/215 |
| 代理公司: | 北京久維律師事務所 11582 | 代理人: | 邢江峰 |
| 地址: | 100744 北京市房山*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 提升 數據庫 數據 校驗 質量 測試 方法 | ||
本發明提供了一種提升數據庫數據校驗質量的測試方法。它包括下列步驟:S1:對單獨使用紙質數據和單獨使用電子數據可能出現的數據質量問題進行分析匯總;S2:數據的初步校驗;S3:根據初步校驗的結果和數據質量分析匯總,進行數據庫數據的二次校驗。該測試方法將紙質數據和電子數據相結合,使得這兩部分數據可以互相補充、互相協同地對數據庫數據質量進行校驗,更全面地覆蓋數據問題,減少了漏檢和誤檢的發生,可提升數據庫數據校驗質量。
技術領域
本發明涉及數據質量分析領域,尤其涉及一種提升數據庫數據校驗質量的測試方法。
背景技術
紙質數據庫和電子數據庫均具有重要的意義。傳統的數據庫單獨使用紙質數據對隊列研究數據進行校驗,在理想情況下,紙質填寫規范,字跡清晰,掃描識別準確率100%時,可以檢測出所有的錄入錯誤和錄入遺漏,無法檢測出填寫錯誤和填寫遺漏,由于實際紙質的填寫可能不夠規范,加上識別系統自身的識別率限制,所以在使用紙質識別數據對進行數據質量校驗時可能會存在漏檢、誤檢等問題。而另一方面,如果單獨使用電子數據對隊列研究數據進行校驗,對于不同的測試而言來說,數據需求不同,所以電子數據庫中的數據很難完全覆蓋紙質紙質的所有數據項,可能出現無法判定具體的錯誤類別、漏檢、誤檢等不必要的錯誤。
發明內容
為了解決上述現有技術的不足之處,本發明的目的在于提供一種提升數據庫數據校驗質量的測試方法,以解決傳統單獨依賴紙質或電子數據庫近數據質量校驗時容易出現漏檢、誤檢的問題。
為了實現上述目的,本發明提供一種提升數據庫數據校驗質量的測試方法,它包括下列步驟:S1:對單獨使用紙質數據和單獨使用電子數據可能出現的數據質量問題進行分析匯總;S2:數據的初步校驗;S3:根據初步校驗的結果和數據質量分析匯總,進行數據庫數據的二次校驗。
優選地,所述S1中,需要分類數據庫中數據可能存在的錯誤類型和單獨使用紙質數據和單獨使用電子數據進行校驗分別能夠檢出哪些錯誤。
優選地,所述S1中,在數據收集和錄入環節中,由于各種系統因素和人為因素可能會導致隊列研究數據出現填寫遺漏、填寫錯誤、錄入遺漏、錄入錯誤。
優選地,所述S2中,對于某項數據來說,如果錄入數據不存在,而紙質識別數據存在,則可以判定為錄入遺漏。
優選地,所述S2中,如果錄入數據和紙質識別數據不一致,則可以判定為錄入錯誤,這種情況包含了錄入數據存在而紙質識別數據不存在的情況;
優選地,所述S2中,當錄入數據和紙質識別數據同時不存在時,如果電子提取數據存在,則判定為填寫遺漏,反之,則不做校驗;
優選地,所述S2中,當錄入數據和紙質識別數據同時存在并且一致時,如果電子提取數據和它們都不一致,則判定為填寫錯誤,反之,則不做校驗。
優選地,所述S3中,所述數據庫數據的二次校驗包括數據源初始化、狀態判斷、一致性判斷、可信度評估和設置錯誤五個步驟。
優選地,所述S3中,所述提升數據庫數據校驗質量的測試方法的運行情況根據錄入數據、紙質識別數據和電子提取數據是否存在來確定。
優選地,所述S3中,在所述設置錯誤階段需要借用查準率和查全率指標來評估校驗的結果,設置錯誤等級。
同現有技術相比,本發明的有益效果體現在:
(1)本發明將紙質數據和電子數據相結合,使得這兩部分數據可以互相補充、互相協同地對數據庫數據質量進行校驗,更全面地覆蓋數據問題,減少漏檢和誤檢的發生,提升數據庫數據校驗質量
(2)本發明采用多維度的數據對比,提升了數據庫數據校驗的全面性,實現了數據庫數據校驗質量測試的可靠性。
附圖說明
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于九次方大數據信息集團有限公司,未經九次方大數據信息集團有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911046134.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:報刊分發智能管理系統
- 下一篇:一種基于校園的智能管理系統及其方法
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





