[發明專利]數據質量識別方法、裝置、計算機設備和存儲介質在審
| 申請號: | 202110250433.2 | 申請日: | 2021-03-08 |
| 公開(公告)號: | CN112862355A | 公開(公告)日: | 2021-05-28 |
| 發明(設計)人: | 黃利賢 | 申請(專利權)人: | 騰訊科技(深圳)有限公司 |
| 主分類號: | G06Q10/06 | 分類號: | G06Q10/06;G06Q30/02 |
| 代理公司: | 廣州華進聯合專利商標代理有限公司 44224 | 代理人: | 李文淵 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據 質量 識別 方法 裝置 計算機 設備 存儲 介質 | ||
本申請涉及一種數據質量識別方法、裝置、計算機設備和存儲介質。該方法包括:獲取目標調查數據;目標調查數據包括至少兩個數據平臺采集得到的調查數據;每個數據平臺的調查數據包括調查指標和調查指標對應的統計數據;根據目標調查數據,獲取兩兩數據平臺的各個調查指標的統計數據集合;對兩兩數據平臺的各個調查指標的統計數據集合進行線性回歸處理,得到兩兩數據平臺的調查數據的多個質量評估參數;根據多個質量評估參數,確定對兩兩數據平臺的調查數據的質量識別結果;根據對兩兩數據平臺的調查數據的質量識別結果,確定對目標調查數據的目標質量識別結果。采用本方法,能夠提高數據質量識別準確率,保證了大數據的數據挖掘結果的有效性。
技術領域
本申請涉及數據處理技術領域,特別是涉及一種數據質量識別方法、裝置、計算機設備和存儲介質。
背景技術
隨著大數據技術的發展,通常需要對采集得到的數據進行數據分析;但在進行數據分析之前,需要評估采集得到的數據的數據質量,以保證數據分析結果的可靠性。
在問卷調查場景中,一般是通過人工主觀評估調查數據的數據質量,但是在人工主觀評估數據質量的過程中,容易出現錯誤,導致數據質量的識別準確率較低。
發明內容
基于此,有必要針對上述技術問題,提供一種能夠提高數據質量的識別準確率的數據質量識別方法、裝置、計算機設備和存儲介質。
一種數據質量識別方法,所述方法包括:
獲取目標調查數據;所述目標調查數據包括至少兩個數據平臺采集得到的調查數據;每個數據平臺的調查數據為相應的數據平臺針對同一份調查表對相同用戶群體所采集得到,包括調查指標和所述調查指標對應的統計數據;
根據所述目標調查數據,獲取兩兩數據平臺的各個調查指標的統計數據集合;
對所述兩兩數據平臺的各個調查指標的統計數據集合進行線性回歸處理,得到所述兩兩數據平臺的調查數據的多個質量評估參數;
根據所述兩兩數據平臺的調查數據的多個質量評估參數,確定對所述兩兩數據平臺的調查數據的質量識別結果;
根據對所述兩兩數據平臺的調查數據的質量識別結果,確定對所述目標調查數據的目標質量識別結果。
一種數據質量識別裝置,所述裝置包括:
數據獲取模塊,用于獲取目標調查數據;所述目標調查數據包括通過至少兩個數據平臺采集得到的調查數據;每個數據平臺的調查數據為相應的數據平臺針對同一份調查表對相同用戶群體所采集得到,包括調查指標和所述調查指標對應的統計數據;
集合獲取模塊,用于根據所述目標調查數據,獲取兩兩數據平臺的各個調查指標的統計數據集合;
參數獲取模塊,用于對所述兩兩數據平臺的各個調查指標的統計數據集合進行線性回歸處理,得到所述兩兩數據平臺的調查數據的多個質量評估參數;
結果確定模塊,用于根據所述兩兩數據平臺的調查數據的多個質量評估參數,確定對所述兩兩數據平臺的調查數據的質量識別結果;
質量識別模塊,用于根據對所述兩兩數據平臺的調查數據的質量識別結果,確定對所述目標調查數據的目標質量識別結果。
一種計算機設備,包括存儲器和處理器,所述存儲器存儲有計算機程序,所述處理器執行所述計算機程序時實現以下步驟:
獲取目標調查數據;所述目標調查數據包括至少兩個數據平臺采集得到的調查數據;每個數據平臺的調查數據為相應的數據平臺針對同一份調查表對相同用戶群體所采集得到,包括調查指標和所述調查指標對應的統計數據;
根據所述目標調查數據,獲取兩兩數據平臺的各個調查指標的統計數據集合;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于騰訊科技(深圳)有限公司,未經騰訊科技(深圳)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110250433.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種電力絕緣子環?;厥赵倮锰幚硐到y
- 下一篇:電壓生成單元及電子設備
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





