[發明專利]一種數據分析模型在審
| 申請號: | 201810089490.5 | 申請日: | 2018-01-30 |
| 公開(公告)號: | CN108363754A | 公開(公告)日: | 2018-08-03 |
| 發明(設計)人: | 王帆;葛靜;賀東明 | 申請(專利權)人: | 武漢藍星軟件技術有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06N3/08 |
| 代理公司: | 上海精晟知識產權代理有限公司 31253 | 代理人: | 馮子玲 |
| 地址: | 430000 湖北*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據分析模型 分析單元 數據預處理單元 數據變換模塊 數據集成模塊 數據清理模塊 分類 輸入端連接 分類模塊 規約模塊 數據分析 學習模塊 預處理 分析處理過程 數據分析技術 數據分析結果 數據完整性 雙向連接 輸出端 輸出 創建 保證 | ||
本發明公開了一種數據分析模型,包括數據預處理單元和分類分析單元,數據預處理單元的輸出端與分類分析單元的輸入端連接,數據預處理單元由數據清理模塊、數據集成模塊、數據變換模塊和數據規約模塊組成,數據清理模塊、數據集成模塊、數據變換模塊和數據規約模塊的輸出單均與分類分析單元的輸入端連接,分類分析單元包括學習模塊和分類模塊,學習模塊與分類模塊實現雙向連接,涉及數據分析技術領域。該數據分析模型,解決了現有的數據分析模型和方式相對復雜的情況,在進行分析處理過程中增加了前者的預處理,進而提升了數據分析的精準性能,達到了對數據分析模型的創建,保證了數據分析后的數據完整性,提高了實際的數據分析結果。
技術領域
本發明涉及數據分析技術領域,具體為一種數據分析模型。
背景技術
數據分析是指用適當的統計分析方法對收集來的大量數據進行分析,提取有用信息和形成結論而對數據加以詳細研究和概括總結的過程。這一過程也是質量管理體系的支持過程。在實用中,數據分析可幫助人們作出判斷,以便采取適當行動。
數據分析的數學基礎在20世紀早期就已確立,但直到計算機的出現才使得實際操作成為可能,并使得數據分析得以推廣。數據分析是數學與計算機科學相結合的產物。
現有的數據分析模型和方式相對復雜,在進行分析處理過程中缺乏前者的預處理,沒有對數據的進一步的清理、集成、變換和規約,進而降低了數據分析的精準性能,達不到對數據分析模型的創建,更加的影響了數據分析后的數據,降低了實際的數據分析結果。
發明內容
(一)解決的技術問題
針對現有技術的不足,本發明提供了一種數據分析模型,解決了降低了數據分析的精準性能,達不到對數據分析模型的創建,更加的影響了數據分析后的數據,降低了實際數據分析結果的問題。
(二)技術方案
為實現以上目的,本發明通過以下技術方案予以實現:一種數據分析模型,包括數據預處理單元和分類分析單元,所述數據預處理單元的輸出端與分類分析單元的輸入端連接,所述數據預處理單元由數據清理模塊、數據集成模塊、數據變換模塊和數據規約模塊組成,并且數據清理模塊、數據集成模塊、數據變換模塊和數據規約模塊的輸出單均與分類分析單元的輸入端連接,所述分類分析單元包括學習模塊和分類模塊,并且學習模塊與分類模塊實現雙向連接。
優選的,所述學習模塊包括訓練樣本輸入,并且訓練樣本輸入的輸出端與分類算法的輸入端連接,所述分類算法的輸出端與分類模型的輸入端連接,并且分類模型與測試樣本輸入實現雙向連接。
優選的,所述分類模塊包括新數據,并且新數據與分類模型實現雙向連接。
優選的,所述數據清理模塊可以使用下列方法消除:使用一個全局常量填充、使用屬性平均值填充、使用相同類的屬性平均值填充、使用最可能的值填充,需要采用預測算法,預測給定樣本的最可能的值并填充、數據不一致可以通過元數據消除。
優選的,所述數據集成模塊將多個數據源中的數據結合起來存放在一個一致的數據存儲(如數據倉庫)中,這些數據源可能包括多個數據庫、數據立方體或一般文件,在數據集成時,需要消除冗余一能夠由另外的屬性“導出”、命名的不一致的屬性。
優選的,所述數據變換模塊將屬性數據按比例縮放,使之落入一個小的特定區間,如-1.0到1.0或O.O到1.0。
優選的,所述數據規約模塊可以用來得到數據集的歸約表示,它小得多,但仍接近于保持原數據集的完整性,在歸約后的數據集上分析將更有效,并產生相同或幾乎相同的分析結果歸約方法主要有:屬性歸約、記錄歸約。
優選的,所述分類分析單元具體采用前饋神經網絡分類算法,并且前饋神經網絡分類算法由許多單元以適當的方式連接起來構成,單元模仿人腦的神經元,單元之間的連接相當于人腦中神經元的連接。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢藍星軟件技術有限公司,未經武漢藍星軟件技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810089490.5/2.html,轉載請聲明來源鉆瓜專利網。





