[發明專利]一種基于支持向量機的包含未知類別的多分類方法在審
| 申請號: | 201710536516.1 | 申請日: | 2017-07-04 |
| 公開(公告)號: | CN107480690A | 公開(公告)日: | 2017-12-15 |
| 發明(設計)人: | 邢云冰;陳益強;忽麗莎 | 申請(專利權)人: | 中國科學院計算技術研究所 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 北京泛華偉業知識產權代理有限公司11280 | 代理人: | 王勇 |
| 地址: | 100190 北*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 支持 向量 包含 未知 類別 分類 方法 | ||
1.一種基于支持向量機的包含未知類別的多分類方法,包括下列步驟:
1)對于待識別樣本,分別基于每個訓練后的第i類別分類器,識別出該待識別樣本是否屬于第i類別;其中,i=1、2、……N;所述第i類別分類器是用已知的屬于第i類別的樣本構建正樣本集,用已知的屬于其余N-1類別的所有樣本構建負樣本集,基于SVM模型進行訓練而得到的二分類分類器,該二分類分類器用于識別所輸入的樣本是否屬于第i類別;
2)當步驟1)中將待識別樣本輸入每個二分類分類器,所得結果均為否時,認定當前待識別樣本屬于未知類別;當步驟1)中,有且僅有一個二分類分類器的輸出結果為是時,則認定當前待識別樣本屬于這個二分類分類器所對應的類別。
2.根據權利要求1所述的基于支持向量機的包含未知類別的多分類方法,其特征在于,所述步驟2)還包括:當步驟1)中,有多個二分類分類器的輸出結果為是時,直接認定當前待識別樣本屬于未知類別;或者在輸出結果為是的這些二分類分類器所對應的類別的范圍內,采用其它分類方法進一步地分辨當前待識別樣本屬于哪個類別。
3.根據權利要求1所述的基于支持向量機的包含未知類別的多分類方法,其特征在于,所述步驟1)中,所述第i類別分類器按下述方法訓練:
11)取第i類別作為正類別,其余N-1種類別作為反類別;
12)基于SVM模型進行訓練而得到作為第i類別分類器的二分類分類器。
4.根據權利要求3所述的基于支持向量機的包含未知類別的多分類方法,其特征在于,所述步驟12)中,在進行訓練時,先將已知樣本從原始空間映射到新的特征空間,得到對應的特征空間變換后的樣本以使得已知樣本的類別分界線更加規則。
5.根據權利要求4所述的基于支持向量機的包含未知類別的多分類方法,其特征在于,所述步驟12)中,
SVM模型的目標函數被配置為:利用樣本數據在特征空間中尋找一個超球面其中是超球面的球心,R是超球面的半徑,如果f(x)<R則輸出y=+1表示該樣本屬于正類別,如果f(x)>R則輸出y=-1,表示該樣本屬于反類別;
尋找最優的超球面,使得該超球面的表面積最小化并且已知樣本數據離該超球面的最小距離最大化;然后根據所述的最優的超球面得到SVM模型的最優參數。
6.根據權利要求5所述的基于支持向量機的包含未知類別的多分類方法,其特征在于,所述步驟12)中,使得已知樣本數據離該超球面的最小距離最大化是:將正反類別樣本數據離原超球面的最小距離分別形成兩個同心超球面,使得同心超球面組成的超球殼的殼厚度最大化。
7.根據權利要求5所述的基于支持向量機的包含未知類別的多分類方法,其特征在于,所述目標函數為:
約束條件為其中C1和C2是經驗系數,d相當于滿足約束條件的樣本數據離超球面的最小距離,ξi為松弛變量;
所述的SVM模型的最優參數為:
8.根據權利要求7所述的基于支持向量機的包含未知類別的多分類方法,其特征在于,所述步驟12)中,所述的SVM模型的最優參數求解方法如下:
121)通過拉格朗日乘子法得到目標函數的拉格朗日函數;
122)令拉格朗日函數中部分變量的偏導為零,得到求解目標函數的對偶問題,該對偶問題中的核函數選擇高斯核或多項式核;
123)通過二次規劃算法求解所述對偶問題,根據已知樣本數據訓練得到參數和R。
9.根據權利要求7所述的基于支持向量機的包含未知類別的多分類方法,其特征在于,所述步驟12)中,所述特征空間變換能夠使得SVM模型的類別線性可分或聚集可分。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院計算技術研究所,未經中國科學院計算技術研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710536516.1/1.html,轉載請聲明來源鉆瓜專利網。





