[發明專利]一種數據分析模型在審
| 申請號: | 201810089490.5 | 申請日: | 2018-01-30 |
| 公開(公告)號: | CN108363754A | 公開(公告)日: | 2018-08-03 |
| 發明(設計)人: | 王帆;葛靜;賀東明 | 申請(專利權)人: | 武漢藍星軟件技術有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06N3/08 |
| 代理公司: | 上海精晟知識產權代理有限公司 31253 | 代理人: | 馮子玲 |
| 地址: | 430000 湖北*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據分析模型 分析單元 數據預處理單元 數據變換模塊 數據集成模塊 數據清理模塊 分類 輸入端連接 分類模塊 規約模塊 數據分析 學習模塊 預處理 分析處理過程 數據分析技術 數據分析結果 數據完整性 雙向連接 輸出端 輸出 創建 保證 | ||
1.一種數據分析模型,包括數據預處理單元(1)和分類分析單元(2),所述數據預處理單元(1)的輸出端與分類分析單元(2)的輸入端連接,其特征在于:所述數據預處理單元(1)由數據清理模塊(101)、數據集成模塊(102)、數據變換模塊(103)和數據規約模塊(104)組成,并且數據清理模塊(101)、數據集成模塊(102)、數據變換模塊(103)和數據規約模塊(104)的輸出單均與分類分析單元(2)的輸入端連接,所述分類分析單元(2)包括學習模塊(201)和分類模塊(202),并且學習模塊(201)與分類模塊(202)實現雙向連接。
2.根據權利要求1所述的一種數據分析模型,其特征在于:所述學習模塊(201)包括訓練樣本輸入(2011),并且訓練樣本輸入(2011)的輸出端與分類算法(2012)的輸入端連接,所述分類算法(2012)的輸出端與分類模型(2013)的輸入端連接,并且分類模型(2013)與測試樣本輸入(2014)實現雙向連接。
3.根據權利要求1所述的一種數據分析模型,其特征在于:所述分類模塊(202)包括新數據(2021),并且新數據(2021)與分類模型(2013)實現雙向連接。
4.根據權利要求1所述的一種數據分析模型,其特征在于:所述數據清理模塊(101)可以使用下列方法消除:使用一個全局常量填充、使用屬性平均值填充、使用相同類的屬性平均值填充、使用最可能的值填充,需要采用預測算法,預測給定樣本的最可能的值并填充、數據不一致可以通過元數據消除。
5.根據權利要求1所述的一種數據分析模型,其特征在于:所述數據集成模塊(102)將多個數據源中的數據結合起來存放在一個一致的數據存儲(如數據倉庫)中,這些數據源可能包括多個數據庫、數據立方體或一般文件,在數據集成時,需要消除冗余一能夠由另外的屬性“導出”、命名的不一致的屬性。
6.根據權利要求1所述的一種數據分析模型,其特征在于:所述數據變換模塊(103)將屬性數據按比例縮放,使之落入一個小的特定區間,如-1.0到1.0或O.O到1.0。
7.根據權利要求1所述的一種數據分析模型,其特征在于:所述數據規約模塊(104)可以用來得到數據集的歸約表示,它小得多,但仍接近于保持原數據集的完整性,在歸約后的數據集上分析將更有效,并產生相同或幾乎相同的分析結果歸約方法主要有:屬性歸約、記錄歸約。
8.根據權利要求1所述的一種數據分析模型,其特征在于:所述分類分析單元(2)具體采用前饋神經網絡分類算法,并且前饋神經網絡分類算法由許多單元以適當的方式連接起來構成,單元模仿人腦的神經元,單元之間的連接相當于人腦中神經元的連接。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢藍星軟件技術有限公司,未經武漢藍星軟件技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810089490.5/1.html,轉載請聲明來源鉆瓜專利網。





