[發明專利]一種智能工廠中多模態制造數據預處理的方法在審
| 申請號: | 201910540327.0 | 申請日: | 2019-06-21 |
| 公開(公告)號: | CN110275868A | 公開(公告)日: | 2019-09-24 |
| 發明(設計)人: | 王維龍;楊開益;郭文水;梅雪松 | 申請(專利權)人: | 廈門嶸拓物聯科技有限公司;廈門數孿科技有限公司 |
| 主分類號: | G06F16/16 | 分類號: | G06F16/16;G06F16/172;G06F16/182;G06Q50/04 |
| 代理公司: | 廈門市精誠新創知識產權代理有限公司 35218 | 代理人: | 何家富 |
| 地址: | 361001 福建省廈門*** | 國省代碼: | 福建;35 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 制造數據 多模態 集成模型 訓練集 神經網絡模型 預處理 聚類結果 構建 工業數據采集系統 保障數據 多級優化 使用數據 智能 數據處理 聚類 去噪 填充 清洗 采集 分類 環節 | ||
1.一種智能工廠中多模態制造數據預處理的方法,其特征在于,包括以下步驟:
S1:接收工業數據采集系統所采集的制造數據,并將其構成訓練集D=(d1,d2,...dx,...,dn),其中n為數據的個數;
S2:對訓練集D進行聚類得到聚類結果,構建神經網絡模型,根據訓練集D和其聚類結果對神經網絡模型進行訓練后得到最終的多模態制造數據集成模型;
所述對訓練集D進行聚類包括以下步驟:
S201:初始化參數:
將訓練集D劃分為z組,每組的聚類中心設為Cy,其中下標y=1,2,3,...,z,設定迭代次數h=0、最大迭代次數H和閾值ε;
S202:用在[0,1]范圍內的隨機數構建x×y的隸屬度矩陣L,矩陣中的任意元素Lxy滿足如下公式:
其中,Lxy表示訓練集D中的數據x對于聚類中心Cy的隸屬程度;
S203:判斷迭代次數h是否小于最大迭代次數H,若小于,則設定h=h+1,進入S204,否則,進入S208;
S204:計算每組的聚類中心Cy:
S205:計算目標函數J:
其中,Fxy=||Dx-Cy||,表示訓練集中第x個數據到第y組的聚類中心Cy的歐幾理德距離;
S206:判斷目標函數J是否小于閾值ε,若小于,則進入S208,否則,進入S207;
S207:更新隸屬度矩陣,返回S203,其中隸屬度矩陣的更新公式為:
其中,k為參數變量;
S208:輸出聚類結果Lx:
其中:Lx為訓練集D中的數據x的聚類劃分,公式表示當x固定時,查找最大的Lxy;
S3:通過多模態制造數據集成模型對需要處理的制造數據集進行分類;
S4:對制造數據集進行去噪處理;
S5:對制造數據集進行去冗處理;
S6:識別制造數據集中的缺失值,對缺失值進行填充。
2.根據權利要求1所述的方法,其特征在于:步驟S2中,所述神經網絡模型為三層BP神經網絡,其輸入層神經元個數m=7,輸出層神經元個數n=1,隱含層神經元個數p由公式確定。
3.根據權利要求1所述的方法,其特征在于:步驟S4中的去噪處理具體為:
S401:加載制造數據集;
S402:構建噪聲識別函數:
其中,x表示制造數據集中的數據,μ表示制造數據集中數據的均值,σ表示標準差;
S403:任取制造數據集中的數據,計算噪聲識別函數f(x),針對制造數據,若其在噪聲識別函數f(x)的(μ-1.5σ,μ+1.5σ)以外的概率小于0.15%時,則判定x為噪聲數據;
S404:清除噪聲數據,直至制造數據集中所有數據均計算完成。
4.根據權利要求1所述的方法,其特征在于:步驟S5的去冗處理具體為:
S501:加載制造數據集;
S502:針對制造數據集中的每個數據,將其劃分為若干個數據塊,計算每個數據塊的64位加權哈希值并按位累加,若每位大于1則記1,否則記0,生成指紋集;
S503:針對指紋集中的每個指紋,兩兩比對每兩個“指紋”之間的碼距,若碼距小于設定的閾值時,判定為冗余數據;
S504:清除冗余數據,直至所有指紋均比對完畢。
5.根據權利要求1所述的方法,其特征在于:步驟S6具體為:
S601:加載制造數據集;
S602:采用決策樹分類法定位制造數據集中缺失值的具體位置,識別缺失值的屬性;
S603:查找制造數據集中與缺失值的對應屬性具有相鄰時間區域的所有數值;
S6O4:計算查找的數值的平均值并將平均值填充至缺失值位置處。
6.根據權利要求1所述的方法,其特征在于:所述的制造數據通過分布式文件系統HDFS進行存儲,采用Spark大數據處理引擎、Spark彈性分布式數據集的形式進行緩存。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廈門嶸拓物聯科技有限公司;廈門數孿科技有限公司,未經廈門嶸拓物聯科技有限公司;廈門數孿科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910540327.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種提取解析安卓手機文件的方法
- 下一篇:一種扁平文件處理方法及相關裝置





