[發明專利]采用最小最大概率機的分離概率的有監督線性降維方法在審
| 申請號: | 201810371801.7 | 申請日: | 2018-04-24 |
| 公開(公告)號: | CN108845974A | 公開(公告)日: | 2018-11-20 |
| 發明(設計)人: | 宋士吉;鞏延上;張玉利;黃高 | 申請(專利權)人: | 清華大學 |
| 主分類號: | G06F17/15 | 分類號: | G06F17/15 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 廖元秋 |
| 地址: | 100084*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 線性降維 最大概率 概率 降維 投影矩陣 投影向量 計算機機器學習 共軛梯度法 距離度量 統計學習 應用效果 區分度 樣本集 監督 多維 維度 樣本 輸出 分類 優化 保證 | ||
1.一種采用最小最大概率機的分離概率的有監督線性降維方法,其特征在于,該方法包括以下步驟:
1)建立采用最小最大概率機的分離概率的有監督線性降維DR-MPM模型;
令模型的輸入為樣本集樣本集中第i個個樣本xi對應的類別標簽記為ci,=1,2,...,n,樣本集的類別總數為K,模型的輸出為投影矩陣wi為構成投影矩陣的第i個投影向量;其中,n為輸入的樣本集中的樣本序號,d為樣本原始維數,p為目標維數,p<d,R表示實數集;
2)對p的取值進行判定:若p=1,則為單一投影向量目標,進入步驟3);若p>1,則為多個投影向量目標,進入步驟4);
3)單一投影向量目標下的降維方法;具體步驟如下:
3-1)確定單一投影向量目標下DR-MPM模型的目標函數;
當p=1時,投影矩陣W變為一個投影向量記為w;則DR-MPM模型為一個無約束的最大化最優問題,模型的目標函數如式(1)所示:
其中,
式中,為第i類樣本的集合,為第k類樣本的集合,1≤k≤K,∑ij為第i類樣本和第j類樣本的類間離散度,∑i為第i類樣本的類內離散度,為第k類樣本的均值;
3-2)對DR-MPM模型求解;
將目標函數式(1)等價為最小化以下目標函數:
式(5)所示的目標函數為一個無約束的最小化非凸問題,采用共軛梯度法對式(5)進行優化求解,具體步驟如下:
3-2-1)設定迭代序號t=0,允許誤差ε>0,將投影向量w初始化為一個隨機的d×1向量w(0);
3-2-2)計算目標函數式(5)在w(t)上的導數:
其中,
則共軛方向計算如下:
其中,
3-2-3)更新投影向量w;
w(t+1)=w(t)+α(t)d(k) (10)
其中,α(t)由線性搜索得到,使得f(w(t)+α(t)d(t)=minαf(w(t)+αd(t));
3-2-4)判定:若達到收斂條件,即||d(t)||<ε或‖w(t+1)-w(t)‖<ε時,則迭代終止,得到DR-MPM模型的最優解為w*=w(t+1),降維完畢;否則,設定t:=t+1,重新返回至步驟3-2-2),繼續迭代;
4)多個投影向量目標下的降維方法;具體步驟如下:
4-1)確定多個投影向量目標下DR-MPM模型的目標函數;
當p>1時,構成投影矩陣的每一個投影向量的目標函數與式(1)相同;對于該投影矩陣,增加約束:WTStW=I,即:
其中St=Sw+Sb,且:
其中,對于投影矩陣中第一個投影向量,即投影矩陣的第一列,通過重復步驟3)計算單一投影向量目標下模型的最優解進行獲取,然后,利用求解得到第一個投影向量,求得下一個新的投影向量;當已經求解前r個投影向量w1,w2,...,wr之后,r<p,第r+1個投影向量wr+1存在于由矩陣的列向量線性擴張的子空間中,即:
其中,
Wr=(w1,w2,…,Wr)
因此,存在一個向量vr,滿足:
wr+1=Arvr (14)
將式(14)帶入到目標函數式(1)中,得到無約束優化問題如式(15)所示:
其中,
對式(15)求解,得到wr+1;
對wr+1進行歸一化:
則由前r個投影向量求得了第r+1個投影向量;
令Wr+1=(Wr,wr+1),繼續迭代,直至得到所有p個投影向量,則最終求解得到的投影矩陣為:
W*=Wp
降維完畢。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學,未經清華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810371801.7/1.html,轉載請聲明來源鉆瓜專利網。





