[發明專利]一種基于并行化主成分分析算法的數據降維方法在審
| 申請號: | 201710384662.7 | 申請日: | 2017-05-26 |
| 公開(公告)號: | CN107273917A | 公開(公告)日: | 2017-10-20 |
| 發明(設計)人: | 王勇;楊曉東;陳炬光;楊晨;張應福 | 申請(專利權)人: | 電子科技大學 |
| 主分類號: | G06K9/62 | 分類號: | G06K9/62 |
| 代理公司: | 成都金英專利代理事務所(普通合伙)51218 | 代理人: | 袁英 |
| 地址: | 610041 四川省成*** | 國省代碼: | 四川;51 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 并行 成分 分析 算法 數據 方法 | ||
1.一種基于并行化主成分分析算法的數據降維方法,包括步驟:
S1:把待降維的高維數據構造成樣本數據矩陣Dn×m;
S2:計算所述樣本數據矩陣Dn×m的協方差矩陣Cm×m;
S3:計算所述協方差矩陣Cm×m的m個特征值和對應的m個特征向量;
S4:根據所述特征值和特征向量確定主成分數量k;
S5:利用前k大特征值對應的特征向量構造變換矩陣TransMat,利用變換矩陣計算主成分矩陣,所述主成分矩陣即是降維后的數據;
其特征在于,所述協方差矩陣Cm×m的計算,包括以下子步驟:
S21:分配N個映射函數Mapper;
S22:分配一個歸約函數Reducer,所述Reducer的輸入是所述每個Mapper的輸出結果;
S23:將所述Reducer的匯總結果代入協方差矩陣計算公式。
2.根據權利要求1所述的一種基于主成分分析算法的數據降維方法,其特征在于,所述主成分數量k的計算,包括子步驟:
S41:對所述特征值和其對應的特征向量進行排序;
S42:根據方差貢獻率公式計算滿足條件的最小k,所述的最小k即是主成分數量k。
3.根據權利要求1所述的一種基于并行化主成分分析算法的數據降維方法,其特征在于,所述主成分矩陣的計算,包括以下子步驟:
S51:根據所述排序后的特征值和其對應的特征向量,取前k大特征值對應的特征向量構造變換矩陣TransMat;
S52:若待降維樣本數據矩陣Dn×m能夠一次性加載到內存,則將所述樣本數據矩陣Dn×m與所述變換矩陣TransMat相乘得到主成分矩陣,即降維后的數據。
4.根據權利要求3所述的一種基于并行化主成分分析算法的數據降維方法,其特征在于,若待降維樣本數據矩陣Dn×m不能一次加載到內存,則所述主成分矩陣的計算,包括以下子步驟:
S61:把所述樣本數據矩陣Dn×m按照所述步驟S2中的分塊方式進行分塊;
S62:把所述步驟S61中每個數據塊與所述變換矩陣TransMat進行相乘,得到該塊的主成分矩陣;
S63:合并每一塊所述步驟S62中的主成分矩陣得到整個樣本數據的主成分矩陣。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于電子科技大學,未經電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710384662.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:隱寫算法未知的信息隱藏檢測方法
- 下一篇:一種樣本數據類別確定方法和設備





