[發(fā)明專利]基于決策樹準(zhǔn)確率和相關(guān)性度量的信號(hào)隨機(jī)森林分類方法、系統(tǒng)及裝置在審
| 申請(qǐng)?zhí)枺?/td> | 202110080937.4 | 申請(qǐng)日: | 2021-01-21 |
| 公開(公告)號(hào): | CN112836731A | 公開(公告)日: | 2021-05-25 |
| 發(fā)明(設(shè)計(jì))人: | 王國(guó)濤;孫志剛;高亞杰;李超然;梁曉雯 | 申請(qǐng)(專利權(quán))人: | 黑龍江大學(xué) |
| 主分類號(hào): | G06K9/62 | 分類號(hào): | G06K9/62;G06K9/00 |
| 代理公司: | 哈爾濱市松花江專利商標(biāo)事務(wù)所 23109 | 代理人: | 時(shí)起磊 |
| 地址: | 150080 黑龍*** | 國(guó)省代碼: | 黑龍江;23 |
| 權(quán)利要求書: | 查看更多 | 說(shuō)明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 決策樹 準(zhǔn)確率 相關(guān)性 度量 信號(hào) 隨機(jī) 森林 分類 方法 系統(tǒng) 裝置 | ||
基于決策樹準(zhǔn)確率和相關(guān)性度量的信號(hào)隨機(jī)森林分類方法、系統(tǒng)及裝置,屬于信號(hào)分類識(shí)別領(lǐng)域。為了解決傳統(tǒng)隨機(jī)森林分類器中單個(gè)決策樹分類器的分類準(zhǔn)確率低的問(wèn)題。本發(fā)明首先建立決策樹,用3組預(yù)留的數(shù)據(jù)集分別對(duì)每棵決策樹進(jìn)行驗(yàn)證,計(jì)算第i棵決策樹的準(zhǔn)確率,將所有決策樹按分類準(zhǔn)確率降序排序;針對(duì)確定的數(shù)據(jù)集,采用向量?jī)?nèi)積方法計(jì)算并保存決策樹之間的內(nèi)積數(shù)值,將向量?jī)?nèi)積小于等于內(nèi)積閾值的決策樹保留,否則將計(jì)算向量?jī)?nèi)積的每一對(duì)決策樹中分類準(zhǔn)確率低的決策樹標(biāo)記為可刪除;按照分類準(zhǔn)確率從低到高依次刪除被標(biāo)記為可刪除的決策樹,直到剩下的決策樹數(shù)量為N;采用最終的分類器投票決定最終的分類結(jié)果。主要用于信號(hào)的分類識(shí)別。
技術(shù)領(lǐng)域
本發(fā)明屬于信號(hào)分類識(shí)別領(lǐng)域,具體涉及一種電子設(shè)備的信號(hào)分類識(shí)別方法、系統(tǒng)及裝置。
背景技術(shù)
在電子設(shè)備檢測(cè)技術(shù)領(lǐng)域,經(jīng)常會(huì)針對(duì)密封電子設(shè)備/密封電子元器件進(jìn)行信號(hào)檢測(cè),但是目前的信號(hào)檢測(cè)方法存在準(zhǔn)確率不高等問(wèn)題,尤其是針對(duì)于類似多余物信號(hào)與組件信號(hào)的檢測(cè)識(shí)別,多余物信號(hào)是密封繼電器受到外界激勵(lì)時(shí),游離的多余物微粒碰撞密封器件內(nèi)壁后因振動(dòng)而發(fā)出的聲音信號(hào);組件信號(hào)是繼電器在施加振動(dòng)后內(nèi)部固有松動(dòng)器件發(fā)生的振動(dòng)信號(hào)。組件信號(hào)和多余物信號(hào)經(jīng)示波器輸出的波形形狀相似,而且有時(shí)存在組件信號(hào)、噪聲信號(hào)覆蓋多余物信號(hào)的情況,這就會(huì)增加多余物信號(hào)識(shí)別的難度。所以現(xiàn)有方法的識(shí)別還存在著諸多問(wèn)題,例如目前利用微粒碰撞噪聲檢測(cè)法識(shí)別多余物信號(hào)主要存在以下問(wèn)題:由于有些密封繼電器內(nèi)部結(jié)構(gòu)復(fù)雜,在進(jìn)行多余物信號(hào)識(shí)別時(shí),干擾較大,對(duì)于檢測(cè)到的信號(hào)進(jìn)行分類時(shí),并不能進(jìn)行準(zhǔn)確區(qū)分;實(shí)際上現(xiàn)有的方法在檢測(cè)其他信號(hào)時(shí)也存在這樣的問(wèn)題,而針對(duì)于多余物信號(hào)與組件信號(hào)問(wèn)題更加突出,目前并沒(méi)有能夠準(zhǔn)確區(qū)分二者的方法。沒(méi)有明確標(biāo)準(zhǔn)斷定信號(hào)種類時(shí),為了杜絕將多余物信號(hào)判為組件信號(hào),即認(rèn)為該器件是合格品而導(dǎo)致發(fā)生航天事故,就會(huì)將該器件作廢棄處理。因此,必須提高多余物信號(hào)識(shí)別與組件信號(hào)的準(zhǔn)確率。而目前多余物信號(hào)檢測(cè)所獲得的準(zhǔn)確率較低,只能達(dá)到75%左右。同時(shí),在多余物信號(hào)的識(shí)別過(guò)程中,容易被外界噪聲信號(hào)所干擾,識(shí)別時(shí)易將組件信號(hào)識(shí)別為多余物信號(hào)或多余物信號(hào)誤判為組件信號(hào)。
決策樹算法是一個(gè)通過(guò)設(shè)定規(guī)則對(duì)數(shù)據(jù)分類的過(guò)程,不同類型的決策樹算法適用于處理不同數(shù)據(jù)類型,目前常用的決策樹算法包括ID3、C4.5和CART。其中,ID3算法采用信息增益作為分裂屬性選擇指標(biāo),選擇分裂后信息增益最大的屬性作為下次劃分標(biāo)準(zhǔn),ID3算法容易理解,但I(xiàn)D3算法不能處理連續(xù)值。為了能對(duì)連續(xù)數(shù)據(jù)進(jìn)行處理,又提出了C4.5 算法,C4.5算法在選擇分裂屬性時(shí)以信息增益率作為指標(biāo),對(duì)于離散和連續(xù)性屬性都能進(jìn)行處理,同時(shí)對(duì)于屬性的缺失不敏感。CART二叉決策樹,在特征選擇時(shí)采用Gini系數(shù)作為屬性選擇標(biāo)準(zhǔn),主要用于二分類問(wèn)題。
由決策樹算法設(shè)計(jì)的單個(gè)決策樹分類器在預(yù)測(cè)時(shí)經(jīng)常有過(guò)擬合問(wèn)題產(chǎn)生,一般通過(guò)集成學(xué)習(xí)避免過(guò)擬合現(xiàn)象在決策樹進(jìn)行分類的過(guò)程中出現(xiàn)。集成學(xué)習(xí),就是將多個(gè)單個(gè)分類器組合在一起對(duì)事物進(jìn)行判斷,使最后取得的分類效果相對(duì)于單一分類器更優(yōu)。在設(shè)計(jì)集成學(xué)習(xí)算法時(shí),使設(shè)計(jì)的基分類器具有泛化能力強(qiáng)、差異度大的特點(diǎn)是構(gòu)建優(yōu)秀集成分類器的關(guān)鍵。常見的集成學(xué)習(xí)方法包括Bagging、Boosting、隨機(jī)森林算法等。
2001年,Breiman以隨機(jī)決策森林算法為基礎(chǔ),并將Bagging算法與CART算法綜合后,提出了隨機(jī)森林算法。在訓(xùn)練樣本集中隨機(jī)地抽取樣本,并且隨機(jī)地在特征集中選取特征,根據(jù)選定的數(shù)據(jù)子集和特征子集建立每一個(gè)決策樹分類器后組合成為隨機(jī)森林分類器,最后由所有的決策樹分類器經(jīng)預(yù)測(cè)、投票的方式得出結(jié)果。
隨機(jī)森林算法有諸如:分類準(zhǔn)確率高于一般的分類算法,由于在取樣階段的隨機(jī)性,降低了算法的過(guò)擬合問(wèn)題;抗噪聲能力增強(qiáng),可以并行運(yùn)算,對(duì)于連續(xù)和離散型數(shù)據(jù)都可以很好的處理等優(yōu)點(diǎn)。但是也存在一些固有的缺點(diǎn):當(dāng)組成隨機(jī)森林分類器中的基分類器數(shù)量較大時(shí),分類器訓(xùn)練的空間和時(shí)間會(huì)相應(yīng)增加。另外,以取樣后又將其放回到數(shù)據(jù)集中的抽樣方式選取樣本子集,不能保證樣本子集中所有樣本點(diǎn)具有好的特征,會(huì)存在某個(gè)決策樹分類器選擇較差的樣本比較多,因此不一定具有良好的分類效果。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于黑龍江大學(xué),未經(jīng)黑龍江大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110080937.4/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測(cè)或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無(wú)須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 提高搜索準(zhǔn)確率的方法和裝置
- 改良對(duì)焦準(zhǔn)確率的鏡頭及其攝像裝置
- 測(cè)量數(shù)據(jù)處理準(zhǔn)確性方法和系統(tǒng)以及數(shù)據(jù)處理方法和系統(tǒng)
- 語(yǔ)音控制準(zhǔn)確率調(diào)整方法和系統(tǒng)
- 高準(zhǔn)確率的氣密檢測(cè)裝置
- 校正準(zhǔn)確率高的振動(dòng)盤
- 標(biāo)注準(zhǔn)確率評(píng)估方法及裝置
- 校正準(zhǔn)確率高的振動(dòng)盤
- 高準(zhǔn)確率激光測(cè)距儀
- 點(diǎn)鈔準(zhǔn)確率改進(jìn)的點(diǎn)鈔機(jī)





