[發(fā)明專利]一種面向橋梁病害評級數(shù)據(jù)的去噪方法有效
| 申請?zhí)枺?/td> | 201910327313.0 | 申請日: | 2019-04-23 |
| 公開(公告)號: | CN110083637B | 公開(公告)日: | 2023-04-18 |
| 發(fā)明(設(shè)計)人: | 周揚(yáng)名;王凱;葉琪;阮彤;翟潔 | 申請(專利權(quán))人: | 華東理工大學(xué) |
| 主分類號: | G06F16/2458 | 分類號: | G06F16/2458;G06N20/00 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 200237 *** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 面向 橋梁 病害 評級 數(shù)據(jù) 方法 | ||
1.一種面向橋梁病害評級數(shù)據(jù)的去噪方法,首先通過對樣本數(shù)據(jù)進(jìn)行兩兩比對獲得沖突對集合,然后根據(jù)樣本在沖突對集合中出現(xiàn)的次數(shù),并結(jié)合樣本的輪廓系數(shù),進(jìn)行噪音數(shù)據(jù)剔除,得到過濾后的數(shù)據(jù)集,緊接著使用stacking方法分別在原始數(shù)據(jù)集和過濾后的新數(shù)據(jù)集上對模型進(jìn)行訓(xùn)練,最后評估并比較兩模型的預(yù)測性能,以驗證本去噪方法的有效性,若確認(rèn)有效,便得到了一個干凈的數(shù)據(jù)集,具體步驟為:
S1、將原始數(shù)據(jù)集中的數(shù)據(jù)進(jìn)行預(yù)處理得到數(shù)據(jù)集W1,對W1中無全序關(guān)系的特征進(jìn)行去除,獲得數(shù)據(jù)集W2,所述原始數(shù)據(jù)集包含各個橋梁的基本信息,各個種類的橋梁病害信息及對應(yīng)的橋梁病害等級標(biāo)簽;
S2、根據(jù)數(shù)據(jù)集W2,基于特征ai的特征值ai,j對不同標(biāo)簽的樣本進(jìn)行兩兩比較,構(gòu)造沖突對ci;
S3、根據(jù)沖突對ci構(gòu)造沖突集合C={c1,c2,…,cN},N是沖突集C的沖突對總數(shù);
S4、統(tǒng)計沖突集合C中樣本sk出現(xiàn)的頻次fk,得到詞典D={sk∶fk};
S5、將詞典D中的樣本按頻次由高到低進(jìn)行排序;
S6、對排序后前t%的樣本在數(shù)據(jù)集W2中計算輪廓系數(shù)s(k),刪除s(k)小于ε的樣本sk,得到過濾后的新數(shù)據(jù)集W3,同時刪除沖突對集合C中包含疑似噪音樣本sk的沖突對,其中t為一個閾值,用于縮小需要計算的樣本數(shù)量;
S7、重復(fù)S4,S5,S6,直至步驟S6中無s(i)小于ε的樣本,ε的值為0;
S8、在數(shù)據(jù)集W1和W3上使用同一種機(jī)器學(xué)習(xí)算法分別訓(xùn)練出模型M1和M3,對兩個模型的橋梁病害等級預(yù)測性能進(jìn)行評估驗證,比較評估模型M3的預(yù)測性能。
2.根據(jù)權(quán)利要求1所述的一種面向橋梁病害數(shù)據(jù)的去噪方法,其特征在于,所述的步驟S1具體包括:
S11、基于數(shù)據(jù)集W1,使用熱卡填充方法,利用最相似樣本的值補(bǔ)足缺失特征值,最相似樣本的度量方法為其中ai,j為數(shù)據(jù)集中第i個樣本的第j個特征的特征值,為缺失的特征值,Na是數(shù)據(jù)集W2的總樣本數(shù),i0為最相似的樣本編號;
S12、刪除對標(biāo)簽值無影響的無用特征;
S13、刪除數(shù)據(jù)集W1中特征值無全序關(guān)系的特征,得到數(shù)據(jù)集W2。
3.根據(jù)權(quán)利要求1所述的一種面向橋梁病害數(shù)據(jù)的去噪方法,其特征在于,所述的步驟S2具體包括:
S21、數(shù)據(jù)集W2的特征集合為A={a1,a2,…,aNi},Ni是數(shù)據(jù)集W2的特征總數(shù);
S22、數(shù)據(jù)集特征ai的特征值集合為D={ai,1,ai,2,…,ai,Na},Na是數(shù)據(jù)集W2的總樣本數(shù),也是特征ai的特征值總數(shù);
S23、首先判斷兩個樣本的標(biāo)簽,若相同,則跳過比較這兩個樣本,若標(biāo)簽不同,則對兩個樣本所有特征下的特征值一一對應(yīng)地比較大小,其計算公式:
若f(A,B)為真,則有A,B構(gòu)成沖突對(A,B);
S24、選定第一個樣本,依次將后面的所有樣本按照步驟S23的方式與第一個樣本進(jìn)行比較,構(gòu)造沖突對,依次進(jìn)行下去,直至迭代到最后一個樣本,然后選定第二個樣本,依次將后面的所有樣本按照步驟S23的方式與第一個樣本進(jìn)行比較,構(gòu)造沖突對,依次進(jìn)行下去,直至迭代到最后一個樣本;同樣地,直到選定倒數(shù)第二個樣本比較完后停止迭代。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于華東理工大學(xué),未經(jīng)華東理工大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910327313.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





