[發(fā)明專利]一種基于特征尺度和子類分裂的分類器在審
| 申請(qǐng)?zhí)枺?/td> | 201910027912.0 | 申請(qǐng)日: | 2019-01-11 |
| 公開(公告)號(hào): | CN109784398A | 公開(公告)日: | 2019-05-21 |
| 發(fā)明(設(shè)計(jì))人: | 朱杰英;盧盛林 | 申請(qǐng)(專利權(quán))人: | 廣東奧普特科技股份有限公司 |
| 主分類號(hào): | G06K9/62 | 分類號(hào): | G06K9/62 |
| 代理公司: | 天津市北洋有限責(zé)任專利代理事務(wù)所 12201 | 代理人: | 潘俊達(dá) |
| 地址: | 523000 廣東省東莞*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 子類 特征尺度 分類器 偏離度 特征矢量 度量 分裂 樣本 機(jī)器視覺技術(shù) 分類過程 模式識(shí)別 樣本中心 異類樣本 受限制 正確率 歸類 下界 偏離 檢測 | ||
1.一種基于特征尺度和子類分裂的分類器,其特征在于:
訓(xùn)練和識(shí)別的步驟如下:
S1、輸入所有訓(xùn)練樣本的特征矢量和類別名;計(jì)算每個(gè)特征在所有樣本上的范圍長度Rf=maxsXs,f-minsXs,f,其中Xs,f表示第s個(gè)樣本的第f個(gè)特征值;然后對(duì)于Rf等于或接近0的,也即Rf≤δf,設(shè)置該特征權(quán)值wf=0,當(dāng)作無效特征,否則設(shè)置wf=1,其中δf是一個(gè)遠(yuǎn)比特征值域長度小的正數(shù);
S2、將每個(gè)類看作一個(gè)子類,對(duì)每個(gè)子類計(jì)算樣本特征中心Cb,f和樣本特征尺度首先計(jì)算出樣本特征中心再計(jì)算樣本特征尺度其中N為該子類的樣本總數(shù),X為特征值,b為子類序號(hào),s為樣本序號(hào),p為正整數(shù);
S3、計(jì)算每個(gè)有效特征的特征尺度下界Lf,可選擇以下兩種方式之一進(jìn)行計(jì)算,但如果平均每一類的不同特征的樣本數(shù)<2,只能使用步驟S31的方式計(jì)算:
S31、Lf=βfRf,其中0<βf≤0.1,βf的值需手動(dòng)調(diào)試或者使用經(jīng)驗(yàn)值;
S32、Lf=μfMf,其中0.001≤μf≤100,Mf為所有子類上的樣本特征尺度去掉的那些值后進(jìn)行排序,中值即為Mf;如果每個(gè)類的樣本充足或者類內(nèi)樣本形態(tài)多樣,μf的取值就小些,反之μf的取值就大些;
然后對(duì)屬于同一種的多個(gè)有效特征的Lf要平均后再賦給它們;無效特征的Lf可以賦值任意一個(gè)正數(shù)即可;
S4、計(jì)算特征尺度Sb,f:如果樣本特征尺度則令特征尺度Sb,f=Lf,否則令如果每個(gè)類的樣本都是單一的,也即任何兩個(gè)類內(nèi)樣本比類間樣本更相似,可以跳過步驟S5;
S5、子類分裂:
先給出計(jì)算公式:偏離度為其中X為目標(biāo)的特征矢量,f為特征序號(hào),Xf為序號(hào)為f的特征值,也即X的第f個(gè)分量,F(xiàn)為特征總數(shù);偏離度比值為其中o為本子類的序號(hào),i為異類樣本所屬子類的序號(hào),X為異類樣本的特征矢量,而另外要建立一個(gè)隨偏離度比值增大而減小的分裂度函數(shù)E(K),要滿足K值在3的附近快速下降,其它區(qū)間慢降,K≥6時(shí)基本降到接近0;
對(duì)每個(gè)子類,如果樣本數(shù)多于一個(gè),收集偏離度比值小的異類樣本,統(tǒng)計(jì)這些異類樣本對(duì)該子類的分裂度,如果達(dá)到或超過給定的閾值(這個(gè)閾值可通過測試來獲得,基本是通用的),對(duì)該子類分裂為兩個(gè)及以上的新子類,分裂的原則是使每個(gè)子類內(nèi)的樣本更相近;再按步驟S2中的方式對(duì)新子類計(jì)算各自的樣本特征中心Cb,f、樣本特征尺度和特征尺度Sb,f;分裂后的子類也要執(zhí)行本步檢測和決定是否需要繼續(xù)分裂;
S6、輸入待識(shí)別目標(biāo)的特征矢量,要求特征類型與訓(xùn)練樣本的一致,計(jì)算該特征矢量到各個(gè)子類的偏離度,得到偏離度最小的那個(gè)子類的所屬類就是識(shí)別到的類。
2.權(quán)利要求1所述的分類器,其特征在于步驟S5中:分裂子類時(shí)可采用以下簡單的方式:設(shè)本子類的序號(hào)為o,先找出這個(gè)比值最大的f,然后在本子類的第f個(gè)特征的樣本均值處分開;Xo,s,f>Co,f的樣本作為一個(gè)子類的樣本,剩余的作為另一個(gè)子類的樣本。
3.根據(jù)權(quán)利要求1所述的分類器,其特征在于:
對(duì)于周期性特征,可以使用更準(zhǔn)確的計(jì)算方式:在步驟S1中輸入周期特征的周期值;在步驟S2中,計(jì)算一個(gè)類的特征中心Cb,f和樣本特征尺度時(shí),需要計(jì)算兩組:設(shè)周期值為T,一組是將所有的樣本中的該特征值全部設(shè)置到[0,T)區(qū)間,計(jì)算特征中心和樣本特征尺度,另一組是全部設(shè)置在[-T/2,T/2)區(qū)間進(jìn)行計(jì)算;最后選擇樣本特征尺度小的那組,并將特征中心設(shè)置到[0,T)區(qū)間;在計(jì)算偏離度時(shí),先將該特征值Xf設(shè)置到[0,T)區(qū)間,計(jì)算距離Dis=|Xf-Cb,f|,如果Dis>T/2,則令Dis=T-Dis,然后將Dis的值取代偏離度計(jì)算公式中的|Xf-Cb,f|這一部分即可。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于廣東奧普特科技股份有限公司,未經(jīng)廣東奧普特科技股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910027912.0/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06K 數(shù)據(jù)識(shí)別;數(shù)據(jù)表示;記錄載體;記錄載體的處理
G06K9-00 用于閱讀或識(shí)別印刷或書寫字符或者用于識(shí)別圖形,例如,指紋的方法或裝置
G06K9-03 .錯(cuò)誤的檢測或校正,例如,用重復(fù)掃描圖形的方法
G06K9-18 .應(yīng)用具有附加代碼標(biāo)記或含有代碼標(biāo)記的打印字符的,例如,由不同形狀的各個(gè)筆畫組成的,而且每個(gè)筆畫表示不同的代碼值的字符
G06K9-20 .圖像捕獲
G06K9-36 .圖像預(yù)處理,即無須判定關(guān)于圖像的同一性而進(jìn)行的圖像信息處理
G06K9-60 .圖像捕獲和多種預(yù)處理作用的組合
- 一種隨機(jī)接入信道資源的分配方法
- 一種終端與基站協(xié)商應(yīng)用支持能力的系統(tǒng)及方法
- 輸入輸出請(qǐng)求調(diào)度方法、存儲(chǔ)控制器和存儲(chǔ)陣列
- 移動(dòng)體檢測裝置以及移動(dòng)體檢測方法
- 移動(dòng)體檢測裝置以及移動(dòng)體檢測方法
- 一種類目上下游關(guān)系計(jì)算方法、類目推薦方法及對(duì)應(yīng)裝置
- 產(chǎn)品及其組合定價(jià)推送方法及裝置、電子設(shè)備、存儲(chǔ)介質(zhì)
- 原子類型定義系統(tǒng)及其原子類型匹配方法
- 一種基于子類訓(xùn)練樣本的遙感監(jiān)督分類方法
- 一種樣式編輯方法、裝置及電子設(shè)備
- 一種對(duì)話文本數(shù)據(jù)處理方法和裝置
- 異常數(shù)據(jù)處理系統(tǒng)和異常數(shù)據(jù)處理方法
- 基于監(jiān)測控制偏離度的既有道路設(shè)施的工后損傷判定方法
- 一種基于網(wǎng)絡(luò)流量的軟件異常檢測方法
- 一種節(jié)點(diǎn)電價(jià)偏離度準(zhǔn)確率的計(jì)算方法、裝置及存儲(chǔ)介質(zhì)
- 基于電池電壓分析問題電芯的方法及裝置、存儲(chǔ)裝置
- 網(wǎng)絡(luò)異常監(jiān)測方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 項(xiàng)目風(fēng)險(xiǎn)管理方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 一種基于標(biāo)準(zhǔn)分的評(píng)標(biāo)專家打分偏離度評(píng)價(jià)方法、裝置
- 在行為偏離模型中基于路徑的推薦節(jié)點(diǎn)的選取方法和裝置





