[發明專利]基于線性判別分析與多元自適應樣條的數據分類方法在審
| 申請號: | 201910357895.7 | 申請日: | 2019-04-30 |
| 公開(公告)號: | CN110097117A | 公開(公告)日: | 2019-08-06 |
| 發明(設計)人: | 李智慧;王帥;劉詠梅 | 申請(專利權)人: | 哈爾濱工程大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 150001 黑龍江省哈爾濱市南崗區*** | 國省代碼: | 黑龍江;23 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 自適應 樣條 線性判別分析 分類 數據分類 感知機 非線性分類 遞歸分割 分段線性 分類特征 分類問題 分類誤差 區間分割 輸入變量 多輸出 訓練集 回歸 降維 算法 預測 | ||
1.一種基于線性判別分析與多元自適應樣條的數據分類方法,其特征在于,包括以下步驟:
步驟一:對訓練樣本集中的待分類的M維向量xo進行線性判別分析,得到降維后的向量x,設置降維后的維數為d,具體為:
步驟1:計算類內散度矩陣Sw:
其中,μj為第j類樣本的均值向量,μ為所有樣本的均值向量,k為類別數,Xj為第j類樣本集;
步驟2:計算類間散度矩陣Sb:
其中,Nj(j=1,2,…,k)為第j類樣本的個數;
步驟3:計算矩陣Sw-1Sb;
步驟4:通過矩陣相似對角化計算Sw-1Sb的最大的d個特征值和對應的d個特征向量(w1,w2,…,wd),得到投影矩陣W,W=[w1,w2,…,wd],W為M行d列矩陣;
步驟5:對訓練樣本集中的每一個樣本特征xo,轉化新的樣本x=WTxo,x即為降成d維的向量;
步驟二:把步驟一得到的x表示成多元自適應回歸樣條基函數Bm(x)的形式,對于x的第m維分量xm,tkm是第k次直線分段的節點,skm∈{-1,1},[·]+表示方括號中的向量只取大于0的部分,xkm是第k次線性分段后的xm,{m,skm,tkm}為Bm(x)的參數,具體為:
步驟1:將每個x值充當節點tkm構成的基函數加入當前基函數參數集basicFunctionList中,basicFunctionList中包括待分割的x的維數dim,節點tkm,對x的basicFunctionList{i}.dim維按照節點值basicFunctionList{i}.tkm劃分成兩個向量,其中一個向量為大于tkm的元素置零,另一個向量為小于tkm的元素置0,將上述兩個向量加入臨時基函數向量集basisTmp中,根據當前基函數建立臨時分類模型,計算當前模型的誤差;
步驟2:將誤差最小值對應的基函數向量加入到基函數向量集basisSet中;
步驟3:根據當前基函數集向量集basisSet建立分類模型;
步驟4:如果當前誤差小于誤差閾值,則退出迭代;basisSet即Bm(x)是用于分類的新的向量,原x由d維變成Km維,整個B(x)的維數用KM表示,對x來說,Km個{m,skm,tkm}即線性分段模型;
步驟三:得到的所有維的基函數B(x)作為分類器的輸入變量建立分類模型,通過感知機方法求解分類模型,具體為:
步驟1:令z=B(x),為z增加一維常數項取值為1,初始化c個KM+1維向量v為全零矩陣;
步驟2:對每一類循環,在第i次循環中,選擇另一個類j,按e=<vi·zi>-<vj·zj>對所有i類樣本zi計算概率差值e:
在所有zi中選擇e最小且為負值的樣本zm,計算vi=vi+zm,vj=vj-zm當所有<vi·zi>><vj·zj>時,或迭代次數達到限制值時,退出迭代,得到的模型是(KM+1)×c維矩陣,用V表示;
步驟四:對于待分類的測試集M維向量x1,得到c維實數向量Pn,具體為:
步驟1:將測試集中待分類的向量x1乘以步驟一中得到的投影矩陣W,得到新的樣本x2=WTx1;取前d維形成降維后的樣本x2;
步驟2:根據步驟二中模型參數中{m,skm,tkm}對x2中的每一維分量xm進行分段,形成分段后的向量B(x2);
步驟3:令z的第一維為全1向量,第二維以后為B(x2),得到z';
步驟4:按Pn=Vz'計算出N個c維實數向量Pn;
步驟5:根據每個Pn的最大值得到其類號。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于哈爾濱工程大學,未經哈爾濱工程大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910357895.7/1.html,轉載請聲明來源鉆瓜專利網。





