[發明專利]一種代價敏感模糊多核分類器在審
| 申請號: | 201810536904.4 | 申請日: | 2018-05-30 |
| 公開(公告)號: | CN108846424A | 公開(公告)日: | 2018-11-20 |
| 發明(設計)人: | 李冬冬;王喆;程陽;張靜;杜文莉 | 申請(專利權)人: | 華東理工大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 200237 *** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 模糊隸屬度 分類器 多核 敏感 樣本 核算 分類器模型 模糊 分類過程 分類性能 訓練樣本 正類樣本 數據集 信息熵 算法 引入 | ||
1.一種代價敏感模糊多核分類器,其特征在于,該分類器的訓練方法包括以下驟:
1)將原始樣本數據劃分為訓練集和測試集兩部分;
2)根據新的模糊隸屬度生成方法,在原始的訓練數據上計算每個樣本的模糊隸屬度;
3)本方法基于多核學習方法,將訓練樣本通過多個核映射到不同的特征空間,每組映射后的數據由基分類器處理;
4)將模糊隸屬度引入多核框架中,然后得出訓練樣本的訓練結果;
5)測試步驟中,將經過映射的測試樣本代入到該模型對應的判別函數中進行識別。
2.根據權利要求1所述的代價敏感模糊多核分類器,其特征在于:步驟2)的模糊隸屬度生成方法,同時基于信息熵和代價敏感,樣本xi的信息熵計算公式為:
c是訓練樣本的類別數,Pj(xi)是根據近鄰規則計算的樣本xi屬于某一類的概率;對每個樣本xi,根據近鄰方法計算其概率:
numj是xcandi中屬于第j類的樣本個數,numcandi是xi的近鄰樣本xcandi的總個數;
接下來,將所有訓練樣本按照其熵的值分為m組,每一組中的樣本都對應一個隸屬度;然后,為每個組設定一個模糊隸屬值,對于第j組,其模糊隸屬值為:
Fj=1-α(j-1),j=1,2,...,m
參數α用來保持Fj的值在(0,1]的范圍之內;參數α要保持Fj的值在(0,1]的范圍之內,故α的范圍應該在在得到所有樣本的熵之后,需要計算每個樣本的模糊隸屬度;在計算模糊隸屬度時,使用代價敏感來控制類間的模糊隸屬度大小;對于兩類問題來說,假設正類和負類的錯分代價分別為C+和C-;那么對于樣本xi,其最終的模糊隸屬度為:
Fi為公式(5)樣本xi的隸屬值。
3.根據權利要求2所述的模糊隸屬度生成方法,樣本的信息熵的計算是基于近鄰方法,此處采用的是沒有任何參數的固定半徑近鄰方法;計算熵需要利用樣本的概率Pj(xi);步驟2中計算Pj(xi)的具體流程如下:
首先,使用固定半徑近鄰方法在所有樣本上計算出半徑R;R的計算流程如下:
利用以下公式計算所有樣本兩兩間的歐氏距離:
是樣本xi和xj的距離,d表示樣本維度;
根據上一步計算的距離,按照以下公式計算半徑:
接著,根據上面計算的半徑R,利用固定半徑最近鄰方法,計算Pj(xi);其中定半徑最近鄰方法的表示如以下公式:
xall是全部訓練樣本,xcandi是樣本xi對應的近鄰樣本;
最后,對每個樣本xi,計算其概率:
numj是xcandi中屬于第j類的樣本個數,numcandi是xcandi的總個數。
4.根據權利要求2所述的模糊隸屬度生成方法,其特征在于,正負類的代價分別設置為C+=1,其中IR稱為不平衡率,它用來衡量數據集的不平衡程度,且其定義如下:
N-和N+分別是負類樣本和正類樣本的數量。
5.權利要求1所述的代價敏感模糊多核分類器,其特征在于,訓練步驟中建立目標函數時采用多核算法MultiV-KMHKS,結合模糊隸屬度,此分類器的目標函數主要包含兩個部分,可以表示為:
第一部分包含兩個項,是經驗風險項,是結構風險項;這兩項可以看成是每個基分類器,它保證分類器的分類正確率;第二項Rv(D)使每個核的輸出都盡量接近所有核的平均輸出;正則化參數cp和γ均大于或等于零;其中和Rv(D)的D是包含模糊隸屬度的矩陣;它們的具體形式如下:
定義向量p指的是第p個核映射;定義偏移量
核矩陣目標函數為:
1指代的是N×1的向量,并且誤差向量bp∈RN×1≥0;此處,D∈RN×N是由模糊隸屬度組成的對角矩陣。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華東理工大學,未經華東理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810536904.4/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:水質預測方法和系統
- 下一篇:基于卷積神經網絡的慕課論壇主題分類方法





