[發明專利]一種基于管道篩選的數據挖掘方法在審
| 申請號: | 201810209628.0 | 申請日: | 2018-03-14 |
| 公開(公告)號: | CN108520006A | 公開(公告)日: | 2018-09-11 |
| 發明(設計)人: | 余敬龍 | 申請(專利權)人: | 廣東能龍教育股份有限公司 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30;G06Q30/02 |
| 代理公司: | 廣州嘉權專利商標事務所有限公司 44205 | 代理人: | 伍傳松 |
| 地址: | 528403 廣東省中山市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據挖掘 篩選 過濾管道 數據記錄 數據存入數據 中小型企業 采集數據 篩選規則 數據倉庫 提取數據 硬件要求 數據量 放入 過濾 倉庫 分類 記錄 | ||
本發明公開了一種基于管道篩選的數據挖掘方法,包括以下步驟,第一步:采集數據記錄;第二步:將數據記錄放入過濾管道;第三步:通過過濾管道里的篩選規則對數據記錄進行分類篩選;第四步:將篩選后的數據存入數據倉庫;第五步:從數據倉庫提取數據。本發明采用管道過濾,數據量和硬件要求低,適合中小型企業,數據挖掘更精準。
技術領域
本發明涉及計算機數據分析和挖掘,特別是一種基于管道篩選的數據挖掘方法。
背景技術
傳統的方法是先把數據存入數據倉庫,再通過數據特點分析,挖掘出有用的信息。
現有的數據挖掘和分析技術目前已經比較成熟,但針對數據集成日益豐富的需求,對于一般企業而言,目前的數據挖掘存在以下問題。第一,數據庫挖掘建立在海量數據基礎上,需要硬件設施也是非常昂貴。目前也就是Goog l e,亞馬遜,淘寶等巨頭公司在使用。第二,數據挖掘需要的技術算法復雜,一般的公司不具備這樣的人才。
發明內容
本發明的目的是提供一種基于管道篩選的數據挖掘方法。本方法主要解決大型數據挖據在一般企業中應用存在的以下問題,第一,數據量問題和硬件問題,大型數據挖掘是以海量數據為基礎,用過樣本分析獲取結果。而本方法,不需要海量樣本,也不需要很多硬件。第二,本方法主要基于規則過濾,而不是樣本分析,所以數據分析更精準。
本發明采用的技術方案是:
一種基于管道篩選的數據挖掘方法,包括以下步驟
第一步:采集數據記錄;
第二步:將數據記錄放入過濾管道;
第三步:通過過濾管道里的篩選規則對數據記錄進行分類篩選;
第四步:將篩選后的數據存入數據倉庫;
第五步:從數據倉庫提取數據。
所述篩選規則基于數據記錄中待篩選的數據分析需求制定而成。
所述篩選規則在過濾管道中設置有動態添加與刪除選項。
所述數據倉庫按照篩選規則將數據歸類存儲。
所述過濾管道在自定義的數據挖掘周期到達之后自動移除篩選規則。
本發明的有益效果:1,采用管道過濾,數據量和硬件要求低,適合中小型企業,數據挖掘更精準。2,篩選規則可自定義,熱插拔,充分滿足企業個性化需求。
附圖說明
下面結合附圖對本發明的具體實施方式做進一步的說明。
圖1是本發明數據挖掘方法的示意圖;
圖2為本發明具體實施例的示意圖。
具體實施方式
如圖1所示,為本發明的一種基于管道篩選的數據挖掘方法,包括以下步驟
第一步:采集數據記錄;
第二步:將數據記錄放入過濾管道;
第三步:通過過濾管道里的篩選規則對數據記錄進行分類篩選;所述篩選規則基于數據記錄中待篩選的數據分析需求制定而成,篩選規則在過濾管道中設置有動態添加與刪除選項。
第四步:將篩選后的數據存入數據倉庫;過濾管道在自定義的數據挖掘周期到達之后自動移除篩選規則。
第五步:從數據倉庫提取數據,數據倉庫按照篩選規則將數據歸類存儲。
如圖2所示,實施例1:具體分析產品銷售情況,以分析5月內土豆,菠蘿,蘋果銷售情況為例。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東能龍教育股份有限公司,未經廣東能龍教育股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810209628.0/2.html,轉載請聲明來源鉆瓜專利網。





