[發明專利]一種基于FP-Growth算法的手機貼標檢測數據分析方法在審
| 申請號: | 201810174321.1 | 申請日: | 2018-03-02 |
| 公開(公告)號: | CN108346007A | 公開(公告)日: | 2018-07-31 |
| 發明(設計)人: | 余旸;梁帆;喬仁曉;王國華 | 申請(專利權)人: | 深圳靈虎至真智能科技有限公司 |
| 主分類號: | G06Q10/06 | 分類號: | G06Q10/06;G06Q50/04 |
| 代理公司: | 北京慧泉知識產權代理有限公司 11232 | 代理人: | 李娜 |
| 地址: | 518067 廣東省深圳市南山區*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 數據立方體 算法 手機貼 謂詞 關聯關系 合格類型 檢測數據 子數據 預處理 海量歷史數據 檢測結果 檢測系統 謂詞集合 支持度 聚合 判定 數據庫 分析 強弱 應用 改造 統計 | ||
本發明一種基于FP?Growth算法的手機貼標檢測數據分析方法:S1,對手機貼標檢測系統檢測結果數據庫進行預處理;S2,對每個子數據立方體應用FP?Growth算法統計識別出每個子數據立方體的頻繁謂詞集;S3,將多個子數據立方體的頻繁謂詞集合并為數據立方體的頻繁謂詞集;S4,得到數據立方體的頻繁謂詞集后,通過計算判定不合格類型與不合格因素的關系強弱。本發明可處理海量歷史數據,結果全面、真實、可靠;借助數據立方體的聚合值獲得支持度,簡化了計算;將FP?Growth算法進行改造,使之只產生不合格類型與不合格因素之間的強關聯關系,而不產生不合格因素與不合格因素之間的強關聯關系,加快了系統的運行速度。
技術領域
本發明涉及一種基于FP-Growth算法的手機貼標檢測數據分析方法,屬于數據處理技術領域。
背景技術
隨著移動互聯網的發展,手機已成為人們生活中必不可少的消費品。全球手機需求爆發性增長推動了整個手機產業的蓬勃發展。為了滿足人們對手機的需求,手機制造商需要加快手機研發速度和生產速度。在手機的生產流水線上,手機制造商需要將多個標簽附于手機上。但是,由于貼標人員的粗心,貼標人員往往會出現貼標不合格的情況。為了提高手機產品出廠合格率,需要對手機貼標進行檢測。
數據關聯是數據庫中存在的一類重要的可被發現的知識。若兩個或多個變量的取值之間存在某種規律性,就稱為關聯。隨著手機生產量的迅速增加,手機貼標檢測數據呈現爆發式增長,傳統的數據統計分析方法已經不再適用于海量手機貼標檢測數據的相關分析。而隨著檢測數據數量的增多,數據之間的相關關系也愈發明顯,所以,亟需一種適用于海量檢測數據的數據分析方法研究手機貼標不合格的關鍵因素。
發明內容
本發明的主要目的是在于提供一種基于FP-Growth算法的手機貼標檢測數據分析方法,旨在對手機制造商手機貼標部門的檢測數據進行數據挖掘和分析,從而為手機生產商貼標流水線的調整提供數據支持。
為了實現上述目的,本發明提供的一種基于FP-Growth算法的手機貼標檢測數據分析方法,包括以下步驟:
S1,對手機貼標檢測系統檢測結果數據庫進行預處理;具體如下:
S11,剔除手機貼標檢測合格的相關結果,保留手機貼標檢測不合格的相關結果;
S12,提取檢測結果中貼標不合格的類型及相關的貼標人員年齡、性別、工位編號以及貼標時間等信息;
S13,將提取的數據進行處理,具體包括對缺失值和異常值的整條數據記錄刪除。
S14,將處理后的數據通過OLAP數據建模工具Workbench生成一個五維數據立方體。該數據立方體由貼標人員年齡、貼標人員性別、時間、工位和貼標不合格類型五維組成。其中,貼標不合格類型維具有漏貼、偏貼、褶皺、標簽有缺陷四個成員。
S15,對得到的五維數據立方體按照不合格類型維中的成員進行OLAP切片操作,得到每個不合格類型維成員所對應的四維子數據立方體。
S2,對每個子數據立方體應用FP-Growth算法統計識別出每個子數據立方體的頻繁謂詞集;
基于FP-Growth算法的子數據立方體的頻繁謂詞集的統計識別步驟如下:
S21,設定FP-Growth算法的最小支持度;
S22,第一次掃描子數據立方體,計算每個維成員的支持度,并與設定的最小支持度比較得到1-項頻繁謂詞集;
S23,第二次掃描子數據立方體,創建FP-tree。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳靈虎至真智能科技有限公司,未經深圳靈虎至真智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810174321.1/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06Q 專門適用于行政、商業、金融、管理、監督或預測目的的數據處理系統或方法;其他類目不包含的專門適用于行政、商業、金融、管理、監督或預測目的的處理系統或方法
G06Q10-00 行政;管理
G06Q10-02 .預定,例如用于門票、服務或事件的
G06Q10-04 .預測或優化,例如線性規劃、“旅行商問題”或“下料問題”
G06Q10-06 .資源、工作流、人員或項目管理,例如組織、規劃、調度或分配時間、人員或機器資源;企業規劃;組織模型
G06Q10-08 .物流,例如倉儲、裝貨、配送或運輸;存貨或庫存管理,例如訂貨、采購或平衡訂單
G06Q10-10 .辦公自動化,例如電子郵件或群件的計算機輔助管理





