[發明專利]數據分析方法、計算機可讀存儲介質及終端設備在審
| 申請號: | 201811517084.0 | 申請日: | 2018-12-12 |
| 公開(公告)號: | CN109670015A | 公開(公告)日: | 2019-04-23 |
| 發明(設計)人: | 褚杰;吳又奎;甄增榮 | 申請(專利權)人: | 中科恒運股份有限公司 |
| 主分類號: | G06F16/33 | 分類號: | G06F16/33;G06F16/215;G06F16/80 |
| 代理公司: | 石家莊國為知識產權事務所 13120 | 代理人: | 秦敏華 |
| 地址: | 050090 河北省石家莊市新石*** | 國省代碼: | 河北;13 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據集中 數據分析 計算機可讀存儲介質 數據分析模型 結構化數據 分析數據 數據清洗 終端設備 非結構化數據 錯誤數據 分析模型 獲取數據 冗余數據 數據采集 數據結構 數據轉換 預設格式 預設數據 數據集 調用 去除 采集 分析 | ||
本發明提供了一種數據分析方法、計算機可讀存儲介質及終端設備,包括:通過數據采集取獲取數據集,所述數據集包含待分析數據,所述待分析數據包含結構化數據、半結構化數據和非結構化數據;針對所述數據集中的任一條數據,將所述數據進行數據轉換,得到預設格式的數據;對所述數據集中的數據進行數據清洗,去除所述數據集中的冗余數據和錯誤數據;調用多個預設數據分析模型中的至少一個數據分析模型,對完成數據清洗的數據集中的數據進行分析。本發明通過對各種數據結構的數據進行采集,并提供多種數據分析模型,解決了現有技術中數據分析不全面的問題。
技術領域
本發明屬于計算機技術領域,尤其涉及一種數據分析方法、計算機可讀存儲介質及終端設備。
背景技術
隨著互聯網技術的飛速發展及數據收集成本的不斷降低,大數據時代已經來臨。大規模數據分析是指對規模巨大的數據進行分析,從中獲得有利于對個體或者群組進行辨識的對象,大規模數據分析技術的社會及市場需求也變得十分緊迫?,F有技術通常只對結構化數據進行分析,或只提供某一種類型的數據分析結果,因此,現有技術缺少一種全面的數據分析方法。
發明內容
有鑒于此,本發明實施例提供了一種數據分析方法、計算機可讀存儲介質及終端設備,以解決現有技術中數據分析不全面的問題。
本發明實施例的第一方面提供了一種數據分析方法,包括:
通過數據采集取獲取數據集,所述數據集包含待分析數據,所述待分析數據包含結構化數據、半結構化數據和非結構化數據;
針對所述數據集中的任一條數據,將所述數據進行數據轉換,得到預設格式的數據;
對所述數據集中的數據進行數據清洗,去除所述數據集中的冗余數據和錯誤數據;
調用多個預設數據分析模型中的至少一個數據分析模型,對完成數據清洗的數據集中的數據進行分析。
本發明實施例的第二方面提供了一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機可讀指令,所述計算機可讀指令被處理器執行時實現如下步驟:
通過數據采集取獲取數據集,所述數據集包含待分析數據,所述待分析數據包含結構化數據、半結構化數據和非結構化數據;
針對所述數據集中的任一條數據,將所述數據進行數據轉換,得到預設格式的數據;
對所述數據集中的數據進行數據清洗,去除所述數據集中的冗余數據和錯誤數據;
調用多個預設數據分析模型中的至少一個數據分析模型,對完成數據清洗的數據集中的數據進行分析。
本發明實施例的第三方面提供了一種終端設備,包括存儲器、處理器以及存儲在所述存儲器中并可在所述處理器上運行的計算機可讀指令,所述處理器執行所述計算機可讀指令時實現如下步驟:
通過數據采集取獲取數據集,所述數據集包含待分析數據,所述待分析數據包含結構化數據、半結構化數據和非結構化數據;
針對所述數據集中的任一條數據,將所述數據進行數據轉換,得到預設格式的數據;
對所述數據集中的數據進行數據清洗,去除所述數據集中的冗余數據和錯誤數據;
調用多個預設數據分析模型中的至少一個數據分析模型,對完成數據清洗的數據集中的數據進行分析。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中科恒運股份有限公司,未經中科恒運股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201811517084.0/2.html,轉載請聲明來源鉆瓜專利網。





