[發明專利]多類別集工業過程數據相似度分析方法在審
| 申請號: | 201810271196.6 | 申請日: | 2018-03-29 |
| 公開(公告)號: | CN108427768A | 公開(公告)日: | 2018-08-21 |
| 發明(設計)人: | 張可;柴毅;程傳陽;游丹妮 | 申請(專利權)人: | 重慶大學 |
| 主分類號: | G06F17/30 | 分類號: | G06F17/30 |
| 代理公司: | 北京眾合誠成知識產權代理有限公司 11246 | 代理人: | 胡柯 |
| 地址: | 400044 重*** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 相似度分析 數據集 工業過程數據 數值表 相似度 預處理 實際數據 數據集中 數據特征 數據維度 研究系統 運行狀態 維度 隱含 抽取 檢索 采集 修正 挖掘 分析 | ||
1.一種多類別集工業過程數據相似度分析方法,其特征在于,具體步驟如下:
1)根據已有樣本數據,設定類別集;
2)采集實際數據,并對實際數據進行預處理;
3)對步驟2)處理后的實際數據,根據步驟1)設定的類別集進行分類,形成若干數據集;
4)從步驟3)中的數據集抽取數據,標記數據來源,作為該類別集的代表數據;
5)針對類別集中每個實際數據的特征,對該類別集中的代表數據進行不同維度的相似度分析,形成相似度數值表;
6)從步驟3)中的數據集重新抽取數據,標記數據來源,作為該類別集的新的代表數據,對該類別集中的新代表數據進行不同維度的相似度分析,形成新的相似度數值表;
7)對相似度數值表進行修正,得到修正后的相似度數值表;
8)對步驟7)中的相似度數值表,多次重復步驟6)與步驟7),當表中的數值都穩定在某個值附近時,結束循環;否則,應繼續增加重復的次數。
2.如權利要求1所述的多類別集工業過程數據相似度分析方法,其特征在于,步驟1)中所述設定類別集的具體方法為:
1-1)根據工業過程數據的屬性和特點,設定數據的特征Xm;
1-2)利用監督學習算法,對樣本數據按照數據特征進行訓練分類得到n個類別集。
3.如權利要求2所述的多類別集工業過程數據相似度分析方法,其特征在于,步驟2)中所述對實際數據進行預處理的具體方法為:剔除掉野點數據,并進行歸一化處理。
4.如權利要求3所述的多類別集工業過程數據相似度分析方法,其特征在于,步驟3)中所述形成若干數據集的具體方法為:將實際數據與n個類別集進行匹配,經過多次迭代后,形成n個數據集。
5.如權利要求4所述的多類別集工業過程數據相似度分析方法,其特征在于,步驟4)中所述抽取數據的具體方法為:利用隨機抽樣的方法,從每個數據集中隨機抽取一組數據,標記數據所屬數據集,作為該數據集的代表數據。
6.如權利要求5所述的多類別集工業過程數據相似度分析方法,其特征在于,步驟5)中所述針對類別集中每個實際數據的特征,對該類別集中的代表數據進行不同維度的相似度分析,形成相似度數值表的具體方法為:
5-1)把n個代表數據集進行兩兩組合,將相似度閾值設為T;
5-2)對于每一個組合,針對其每一個數據特征進行相似度分析,計算其相似度,對滿足相似度閾值的數據按其特征進行組合,進行高一維度分析,直到所有結果都不滿足相似度閾值;
5-3)用百分制的方法對每個數據特征的相似程度進行計分,形成相似度數值表。
7.如權利要求6所述的多類別集工業過程相似度分析方法,其特征在于,步驟5-2)所述的相似度分析的具體方法為:
5-2-1)一維相似度分析:每次選取一個數據特征進行相似度分析,計算其歐氏距離,并統計得分,判斷是否所有結果都大于閾值T,若不是則轉入步驟5-2-2),若是則轉入步驟5-2-5);
5-2-2)二維相似度分析:從一維相似度分析的結果中選取小于閾值T的數據特征,每次選取兩個數據特征進行相似度分析,計算其歐氏距離,并統計得分,判斷是否所有結果都大于閾值T,若不是則轉入步驟5-2-3),若是則轉入步驟5-2-5);
5-2-3)高一維相似度分析:從上一維度相似度分析的結果中選取小于閾值T的數據特征,每次選取兩個數據特征進行相似度分析,計算其歐氏距離;
5-2-4)判斷是否所有結果都大于閾值T,若不是則轉入步驟5-2-3),若是則轉入步驟5-2-5);
5-2-5)計算歐幾里得距離來衡量相似度,計算公式為其中,d為采取特征的維度;當L<T時,判定為相似,當L>T時,判定為不相似,得分記為
8.如權利要求7所述的多類別集工業過程數據相似度分析方法,其特征在于,步驟7)中所述對相似度數值表進行修正的公式為:P=P舊+(P新-P舊)ga,其中,P舊為上一次修正后的相識度數值,P新為本次計算的結果,a為修正系數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶大學,未經重慶大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810271196.6/1.html,轉載請聲明來源鉆瓜專利網。





