[發明專利]一種基于特征選擇的智能制造工業大數據分析方法在審
| 申請號: | 202110559197.2 | 申請日: | 2021-05-21 |
| 公開(公告)號: | CN113537280A | 公開(公告)日: | 2021-10-22 |
| 發明(設計)人: | 吳志生;曾敬其;李倩倩 | 申請(專利權)人: | 北京中醫藥大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62;G06N3/04;G06N3/08;G06Q50/04 |
| 代理公司: | 北京市誠輝律師事務所 11430 | 代理人: | 范盈;李玉娜 |
| 地址: | 102488 北京市房山區良*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 特征 選擇 智能 制造 工業 數據 分析 方法 | ||
本發明提供一種基于特征選擇的智能制造工業大數據分析方法,屬于智能制造領域。所述方法步驟包括:采用特征選擇方法獲取原始數據的代表性子集,確定代表性子集中樣本與工業大數據中樣本的從屬關系;基于代表性子集中樣本與工業大數據中樣本的從屬關系,采用代表性子集中樣本代替工業大數據中樣本,獲得重構后工業大數據;通過重構后工業大數據,實現基于特征提取的工業大數據分析。本發明采用自組織神經網絡實現工業大數據的特征選擇,通過特征選擇獲得的代表性子集,實現智能制造工業大數據的因素分析,過程監測和智能決策。
技術領域
本發明屬于智能制造領域,涉及一種智能制造工業大數據分析方法,具體涉及一種基于特征選擇的智能制造工業大數據分析方法。
背景技術
數據驅動是智能制造的典型特征,工業大數據分析是其中的核心內容。制造過程的工業大數據往往具有多源異構的特點,即變量來源于多個制造單元,變量間分布結構差異較大。工業大數據分析通常采用特征提取的方法,通過變量間的關聯發掘數據特征,如提取特征變量代替原始變量,但變量壓縮的同時改變了數據原本的特征空間。然而,工業大數據的噪音,變量間分布特征的差異和變量中離群值等問題導致了數據特征提取的復雜性。因此,科學有效的工業大數據分析方法是智能制造數據驅動的技術難點。
本發明創造性將特征選擇引入工業大數據分析,建立基于特征選擇的智能制造工業大數據分析方法。區別于特征提取,特征選擇通過從原始樣本集中衍生出具有代表性的子集,降低了噪音對數據特征發掘的干擾,且不改變數據原本的特征空間。此外,本發明創造性采用自組織神經網絡實現工業大數據的特征選擇,通過特征選擇獲得的代表性子集,實現智能制造工業大數據的因素分析,過程監測和智能決策。
發明內容
本發明的目的之一在于提供一種基于特征選擇的工業大數據分析方法。
本發明的另一目的在于提供所述方法在智能制造中的應用,所述應用內容具體包括因素分析,過程監測和智能決策。
為達上述目的,一方面,本發明提供了一種基于特征選擇的工業大數據分析方法,該方法包括如下步驟:
步驟1:采用特征選擇方法獲取原始數據的代表性子集,確定代表性子集中樣本與工業大數據中樣本的從屬關系;
步驟2:基于代表性子集中樣本與工業大數據中樣本的從屬關系,采用代表性子集中樣本代替工業大數據中樣本,獲得重構后工業大數據;
步驟3:通過重構后工業大數據,實現基于特征提取的工業大數據分析。
根據本發明一些具體實施方案,其中,特征選擇方法包括如下步驟:
步驟①:對工業大數據中變量進行歸一化處理;
步驟②:設定自組織特征映射神經網絡輸出層神經元數量和距離計算方法;
步驟③:通過自組織特征映射神經網絡迭代訓練,確定工業大數據中樣本與輸出層神經元的從屬關系;
步驟④:提取全部輸出層神經元的權重向量組成代表性子集,每一個神經元為一個樣本,實現工業大數據的特征選擇。
根據本發明一些具體實施方案,其中,自組織特征映射神經網絡的迭代訓練過程如下:
(1)初始化:定義自組織神經網絡輸出層神經元拓撲結構a×b,輸出層神經元總數K=a*b。對輸出層神經元中與輸入層n個節點相對應的權值賦予[0,1] 區間的隨機值,并進行歸一化處理,得到輸出層神經元權值矩陣 wjp,j=1,2,......K,p=1,2......n。
定義初始學習速率η(0),一般取值為0.2,最大不超過0.5。
定義初始鄰域大小N(0),一般為輸出層陣列幅度a,b中較大值的1/2~1/3。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京中醫藥大學,未經北京中醫藥大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110559197.2/2.html,轉載請聲明來源鉆瓜專利網。





