[發(fā)明專利]一種基于半監(jiān)督學習的GA-SOM聚類方法無效
| 申請?zhí)枺?/td> | 201010576193.7 | 申請日: | 2010-12-07 |
| 公開(公告)號: | CN102024179A | 公開(公告)日: | 2011-04-20 |
| 發(fā)明(設計)人: | 孫雁飛;張順頤;亓晉;顧成杰;朱偉春;王攀 | 申請(專利權)人: | 南京郵電大學 |
| 主分類號: | G06N3/12 | 分類號: | G06N3/12 |
| 代理公司: | 南京經(jīng)緯專利商標代理有限公司 32200 | 代理人: | 許方 |
| 地址: | 210003 *** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 監(jiān)督 學習 ga som 方法 | ||
1.一種基于半監(jiān)督學習的GA-SOM聚類方法,其特征在于,包括如下步驟:
步驟1),對樣本數(shù)據(jù)進行預處理,所述預處理過程包括空值處理、歸一化數(shù)據(jù);
步驟2),采用半監(jiān)督學習策略對預處理后的樣本數(shù)據(jù)進行初始化,具體步驟為:
2)-A、根據(jù)歷史數(shù)據(jù)及專家?guī)扈b定,去除樣本中冗余信息,設樣本X=(x1,x2,...,xm),其中m為樣本總數(shù),經(jīng)由專家?guī)旒皻v史數(shù)據(jù)產(chǎn)生一個關鍵數(shù)據(jù)比例權值β,β∈(0,1),所述關鍵數(shù)據(jù)由專家?guī)旒皻v史數(shù)據(jù)對樣本數(shù)據(jù)進行查詢匹配得出,該數(shù)據(jù)代表某種類別,β即為關鍵數(shù)據(jù)占總數(shù)據(jù)的比例;
2)-B、初始化t=0,t是指循環(huán)次數(shù);
2)-C、對樣本數(shù)據(jù)按照從小至大的順序進行標記,標記數(shù)為:Numtag=mβ+σ,其中σ∈{1,2,...,m-mβ};
2)-D、采用SOM網(wǎng)絡進行數(shù)據(jù)樣本訓練;
2)-E、令t=t+1,返回執(zhí)行2)-C步驟;
2)-F、當滿足條件Numtag=m時,訓練結束,樣本數(shù)據(jù)初始化完成;
步驟3),確定網(wǎng)絡輸入模式:令Xi=(x1,x2,...,xn),其中i表示第i個樣本,n為輸入層節(jié)點數(shù),即為樣本總數(shù);
步驟4),根據(jù)以下公式計算輸入模式Xi與所有輸出節(jié)點間權向量的歐式距離:其中,n表示輸入層節(jié)點數(shù)、y表示輸出層節(jié)點數(shù)、i表示輸入節(jié)點、j表示輸出節(jié)點,wij表示輸入節(jié)點與輸出節(jié)點之間的連接權值,表示第i個輸入節(jié)點下的第k個樣本,n、y、i、j、k均為正整數(shù);
步驟5),取最小歐式距離作為獲勝節(jié)點c;
步驟6),計算獲勝節(jié)點c的適應度值,選出具有最小聚類中心的最大節(jié)點權值Wmax,進而更新獲勝節(jié)點c的權值;其中Wmax=dmin(Ci′,Cj′),即計算Ci′、Cj′這兩個類的聚類中心距離,距離最小適應度最好;具體步驟為:
參數(shù)定義:用Y表示獲勝節(jié)點c的所有樣本空間,yi′表示不同的特征元,即Y={yi′|i′=1,...m′},m′為獲勝節(jié)點c的樣本總數(shù),過程如下:
6)-a步,另t′=0,t′指循環(huán)次數(shù),根據(jù)步驟2)所述的步驟初始化特征子集:
G(t′)={y1,y2,...,yn′};
6)-b步,根據(jù)適應值函數(shù)評價特征元;所述適應值函數(shù)采用優(yōu)化問題的目標函數(shù)選取,即其中Ci′、Cj′表示兩個不同聚類,Pi′、Pj′表示個體被選中的概率,Wmax表示最大權值,dmin表示與Wmax對應的最小聚集中心;
6)-c步,進化體系,具體步驟為:
6)-c-1,初始化計數(shù)器i′=1,判斷i′是否小于m′,當i′小于m′,進入下一步;否則終止迭代進入步驟7);
6)-c-2,母體選擇:通過該個體的適應度與群體其他成員的適應度比值進行選擇,個體被選中的概率Pi′與它的適應度比值成正比,;其中f(yi′)為yi′的適應度值,group_size表示種群大小;yk′與yi′均表示獲勝節(jié)點c某個子代個體;
6)-c-3,母體經(jīng)過交叉產(chǎn)生n′個中間個體(O1,O2,...,On′);n′為正整數(shù);
6)-c-4,n′個中間個體(O1,O2,...,On′)經(jīng)過變異產(chǎn)生n′個全新的子代,即特征子集;
6-d步,將新產(chǎn)生的子代加入G(t′),并計算適應度值;
6-e步,選出適應度從高至低的m′個個體,作為下一次的訓練樣本,即G(t′)→G(t′+1),并轉至6-b步驟;
6-f步,當6-e步的迭代次數(shù)超過樣本總數(shù)m′的2倍時終止迭代;
步驟7),確定獲勝節(jié)點c的鄰域范圍NC,NC取高斯函數(shù)表示,根據(jù)以下公式調(diào)整獲勝節(jié)點c的權向量:其中,表示權值wi′j′的調(diào)整大小,ε(t′)隨時間t′呈衰減趨勢;wi′j′表示獲勝節(jié)點c與輸入節(jié)點之間的連接權值,表示獲勝節(jié)點c的第i′個輸入節(jié)點下的第k′個樣本;以上i′、j′、k′均為正整數(shù);
步驟8),判斷ε(t′)是否為0或迭代達到指定的最大次數(shù),當結果為是,訓練結束,分類不再改變,聚類過程終止;否則轉至步驟3),繼續(xù)執(zhí)行。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京郵電大學,未經(jīng)南京郵電大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201010576193.7/1.html,轉載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:一種新型減速箱傳動軸
- 下一篇:龍頭節(jié)水出水嘴





