[發明專利]一種基于PLM數據庫面向DPIPP工藝信息的挖掘算法有效
| 申請號: | 201610173409.2 | 申請日: | 2016-03-24 |
| 公開(公告)號: | CN105787113B | 公開(公告)日: | 2019-03-19 |
| 發明(設計)人: | 雷金;彭衛平;竇俊豪;張秋華;蔣瑞;胡向陽;雷佻鈺 | 申請(專利權)人: | 武漢大學 |
| 主分類號: | G06F16/903 | 分類號: | G06F16/903;G06F17/16 |
| 代理公司: | 武漢科皓知識產權代理事務所(特殊普通合伙) 42222 | 代理人: | 魯力 |
| 地址: | 430072 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 plm 數據庫 面向 dpipp 工藝 信息 挖掘 算法 | ||
1.一種基于PLM數據庫面向DPIPP工藝信息的挖掘方法,其特征在于,包括:
步驟1,數據進行預處理的步驟:對數據進行規范化處理;數據規范化是將原始數據的格式進行統一,并將源數據轉化到同一個度量單位上,這樣做可以消除原始數據對計算結果的影響;本發明采取的規范化方法如下:對于結構屬性,它表示產品或零件的結構參數,為數值型數據且大小不一;因此需要將這些數據轉換到同一個度量單位上,然后將這些數據映射到同一區間,最后將所有數據保留相同的有效位;為便于后續的計算將結構參數映射到[0.00,1.00]之間,并統一保留小數點后兩位有效數字;經過轉化之后,每個結構參數將變為取值范圍統一的無度量值;
步驟2,對產品進行聚類分析的步驟:具體方法是:首先設置聚類參數:K、C、α、a,其中,K代表聚類的個數,C為聚類代表點數,α為聚類收縮因子,a為閾值;對于一個由p個組件構成的產品模塊,每個組件的某個屬性(結構、功能或工藝)有n個參數,建立其屬性參數矩陣如下:
首先從源數據中抽取一個隨機樣本S,將樣本S分割為一組劃分;然后對每個劃分進行局部聚類,聚類時首先將每個對象看作一個類,計算出所有類之間的距離,取距離最近的兩個類進行合并,合并后的類被當作一個新的類;然后按照收縮因子α從合并后的類中選出C個代表點,這些代表點將代表該類繼續與其他的類進行聚類,直到類的數量達到預先設定的值K;在聚類過程中,如果一個類增長地太慢,就將該類去掉;根據上面的過程可以知道,聚類前需要確定的參數有:需要聚類的個數K,聚類代表點數C和聚類收縮因子α;其中K依據聚類需求進行確定;C依據數據規模進行選取,大規模數據就取較大的值,小規模數據就取較小的值;α取值在0.2~0.7之間聚類結果較好;
步驟3,進行局部聚類的步驟:在準備好聚類數據后需要對選出的樣本用基于歐式距,離公式改進算法進行局部聚類,用聚類算法挖掘出產品模塊工藝之間的相似性,得出產品模塊工藝等價模型,具體是:
聚類時將距離最近的兩個類進行合并,類X和類Y之間的距離用函數d(X,Y)來表示;定義由p個組件構成的產品模塊Mp和由q個組件構成的產品模塊Mq的參數矩陣分別如下:
它們之間距離計算公式如下:
該公式首先計算兩個模塊間產品間的距離,然后將所有距離求和,最后將和值標準化,使距離d(Mp,Mq)∈[0,1];該距離公式可以計算維度不相等的兩個模塊間的距離,并滿足一般距離公式的要求,即:d(A,B)=d(B,A);d(A,A)=0;
最后基于類間合并方法控制相似度μ進行距離合并:首先令相似度μ=1-d,由d的取值范圍可知μ∈[0.00,1.00];然后選取一個聚類相似度閾值a,該閾值根據企業自身需求選取,可選取以下方法作為參考:選取多組明顯相似的產品數據,按照本方法進行相似度計算,取各組計算相似度值的平均值為閾值a;在計算出所有類間的相似度μ后,取μ≥a的類,也就是選取出相似度為a以上的類。
2.根據權利要求1所述的一種基于PLM數據庫面向DPIPP工藝信息的挖掘方法,其特征在于,在完成一次聚類后,按照CURE算法的流程,需要從合并后的類中取出代表點參與后續的聚類;CURE算法中,類的代表點通過如下方式產生:首先計算類的中心點,第一個點為該類中離中心點最遠的點,第二個點為離第一個點最遠的點,依次類推,直到取出最多C個點,然后將這些點按照收縮因子α向中心點收縮,經過收縮后的點就是該類的代表點;這樣取出的代表點可以真實地反映出該類的形狀;在對產品模塊聚類分析時,由于每個模塊的屬性參數是一個矩陣,因此先將每個參數矩陣看做一個點,然后按照中心點計算公式計算出中心矩陣,再根據收縮因子α計算出代表矩陣;定義類Lp和類Lq合并為一個新的類Lp,q,以|Lp|和|Lq|分別表示這兩個類所含產品模塊的個數,以Lp.mean和Lq.mean分別表示這兩個類的中心矩陣,以Lp,q.mean表示合并后的類的中心矩陣,以Lp,q.rep1,Lp,q.rep2,……,Lp,q.repC表示合并后的類的代表矩陣,那么代表矩陣的計算過程是這樣的:
首先按照下列公式計算出中心矩陣
然后按照收縮因子α計算出代表矩陣
Lp,q·repi=Li+α*(Lp,q·mean-Li)
取出代表矩陣后由代表矩陣代表合并后的類參與后續的聚類,依次進行下去,聚類時剔除掉過小的類和增長過慢的類,直到所有類停止增長或者達到所需要的聚類數k;在使用本發明提出的類間合并方法后,后續聚類時需要將所有代表矩陣間的相似度計算出來,然后同樣通過控制相似度μ完成類間合并;由于采用了控制相似度閾值a的方法,合并時需要進行一次重復性篩選,剔除重復的類;需要說明的是不像最小距離聚類,每次聚類無論怎樣都會有兩個類被合并,在采用控制相似度閾值a的方法后,聚類時可能會出現所有類不再增長的現象,這是因為現有的所有的類的相似度達不到相似度閾值a,因此在所有類不再增長時會停止聚類。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于武漢大學,未經武漢大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201610173409.2/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:基于混合引擎的大數據處理方法及系統
- 下一篇:一種大數據冗余檢測方法





