[發明專利]一種基于特征尺度和子類分裂的分類器在審
| 申請號: | 201910027912.0 | 申請日: | 2019-01-11 |
| 公開(公告)號: | CN109784398A | 公開(公告)日: | 2019-05-21 |
| 發明(設計)人: | 朱杰英;盧盛林 | 申請(專利權)人: | 廣東奧普特科技股份有限公司 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 天津市北洋有限責任專利代理事務所 12201 | 代理人: | 潘俊達 |
| 地址: | 523000 廣東省東莞*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 子類 特征尺度 分類器 偏離度 特征矢量 度量 分裂 樣本 機器視覺技術 分類過程 模式識別 樣本中心 異類樣本 受限制 正確率 歸類 下界 偏離 檢測 | ||
本發明屬于模式識別和機器視覺技術領域,具體涉及一種基于特征尺度和子類分裂的分類器的實現方法。該分類器在訓練時,先將每個類看作一個子類,每個子類的每個特征都有各自的特征尺度,特征尺度是用來度量一個特征矢量到一個子類的樣本中心的偏離度的,是有下界限定的。如果類內的樣本形態并不單一,還要檢測每個子類的相近的異類樣本的偏離度比值來決定是否對其分裂成更多的子類。分類過程就是目標的特征矢量離哪個子類的偏離度值最小,就歸類到該子類所屬的類。本分類器的優勢在于識別正確率高,特征范圍量級、樣本形態和分布均不受限制、且可度量到一個類的偏離程度。
技術領域
本發明屬于模式識別和機器視覺技術領域,具體涉及一種基于特征尺度和子類分裂的分類器的實現方法。
背景技術
模式識別是根據輸入的目標信息對目標進行識別或歸類;識別和分類在機器視覺里也經常用到。要實現分類就需要建立分類器,常見的分類器有支撐向量機(SupportVector Machine,SVM)、多層感知機(Multi-Layer Perceptron,MLP)、K-近鄰(KNN)、高斯混合模型(GMM)、最小距離法等等。很多情況下,用來分類的特征類型并不是只有一種,而不同種類的特征在范圍量級上一般也各不相同,因此,相同的差值在不同種類的特征上代表的距離并不一定等價,而多數的分類器內部并沒有考慮這個問題,有考慮也是用樣本標準差、方差或協方差來對輸入的特征值進行歸一化;而這些歸一化尺度如果在所有樣本上統計則受各個類的樣本特征分布的影響比較大,準確性會差,如果在單個類上統計則受較小的歸一化尺度值的影響大,穩定性比較差。另外如果類內的樣本差異不大,可以通過計算和查找離哪個的類的樣本特征中心的距離最近就歸到哪個類;但如果類內樣本差異很大,呈現多態的時候,類內只一個樣本中心是不夠的;可以把每個樣本作為一個中心,比如KNN的方式,但按KNN分類時計算量大且每個類的樣本容量要分布比較平衡才好;也可以對每個類的樣本自動聚類成若干子類,但聚類為多少個子類要手動設置且不一定很合適。因此,亟需對目前的分類器作一些改進。
發明內容
針對現有技術的不足,構造一種基于特征尺度和子類分裂的分類器:針對特征的量級差異,對特征尺度設置下界來達到穩定計算和提高分類正確率的目的;針對類內樣本多態的情況,依據監測樣本到異類和自身類的偏離度比值,采取遞歸分裂子類的方式來降低誤分的幾率;針對周期性特征,在計算距離和統計參數時給出更合理的計算方式。
為實現上述目的,本發明采用如下技術方案:
本發明的分類器的訓練和識別的步驟如下:
S1、輸入所有訓練樣本的特征矢量和類別名;計算每個特征在所有樣本上的范圍長度Rf=maxsXs,f-minsXs,f,其中Xs,f表示第s個樣本的第f個特征值;然后對于Rf等于或接近0的,也即Rf≤δf,設置該特征權值wf=0,當作無效特征,否則設置wf=1,其中δf是一個遠比特征值域長度小的正數;
S2、將每個類看作一個子類,對每個子類計算樣本特征中心Cb,f和樣本特征尺度首先計算出樣本特征中心再計算樣本特征尺度其中N為該子類的樣本總數,X為特征值,b為子類序號,s為樣本序號,p為正整數;
S3、計算每個有效特征的特征尺度下界Lf,可選擇以下兩種方式之一進行計算,但如果平均每一類的不同特征的樣本數<2,只能使用S31的方式計算:
S31、Lf=βfRf,其中0<βf≤0.1,βf的值需手動調試或者使用經驗值;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣東奧普特科技股份有限公司,未經廣東奧普特科技股份有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910027912.0/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種青稞網斑病的識別方法
- 下一篇:基于改進字典學習的多源圖像目標關聯方法





