[發明專利]處理大規模矩陣數據的主成分分析方法在審
| 申請號: | 201611153472.6 | 申請日: | 2016-12-14 |
| 公開(公告)號: | CN106855918A | 公開(公告)日: | 2017-06-16 |
| 發明(設計)人: | 喻文健;谷昱 | 申請(專利權)人: | 清華大學 |
| 主分類號: | G06F19/00 | 分類號: | G06F19/00 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙)11201 | 代理人: | 張潤 |
| 地址: | 10008*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 處理 大規模 矩陣 數據 成分 分析 方法 | ||
1.一種處理大規模矩陣數據的主成分分析方法,其特征在于,包括以下步驟:
S1:在內存中生成一個n行、l列的隨機數矩陣Ω;
S2:選取原始數據矩陣A,并根據所述原始數據矩陣A計算矩陣G和H,并將矩陣G和H存儲于內存中,其中,G=AΩ,H=ATG,所述原始數據矩陣A為m×n矩陣;
S3:初始化變量j=1,并初始化m×l矩陣Q和l×n矩陣B均為零矩陣;
S4:設定G[j,j+b]和Ω[j,j+b]分別為矩陣G和矩陣Ω的第j到j+b列,且當j>1時,計算G[j,j+b]-QBΩ[j,j+b],并將計算結果覆蓋G[j,j+b],其中,b為不超過l-j的非負整數;
S5:對矩陣G[j,j+b]做簡化QR分解,得到m×(b+1)列正交矩陣Q[j,j+b]和上三角方陣R,其中,Q[j,j+b]存儲在矩陣Q的第j到j+b列;
S6:如果j>1,則計算矩陣Q[j,j+b]-Q(QTQ[j,j+b])的簡化QR分解,將得到的m×(b+1)列正交矩陣覆蓋Q[j,j+b],以得到上三角陣為并計算矩陣乘法并將計算結果覆蓋R;
S7:設H[j,j+b]表示矩陣H的第j到j+b列,如果j=1,計算否則計算得到結果為(b+1)×n的矩陣Btemp,并將Btemp存儲在矩陣B的第j到j+b行;
S8:將變量j+b+1的值賦值給變量j;
S9:如果j≤l,則返回執行所述S4,否則執行所述S10;
S10:對矩陣B做奇異值分解:B=UΣVT,其中,矩陣V的前k列為所述前k個主成分向量,Σ的前k個對角元為所述對應的奇異值。
2.根據權利要求1所述的處理大規模矩陣數據的主成分分析方法,其特征在于,在所述S1中,所述參數l為至少比k大5的整數。
3.根據權利要求1所述的處理大規模矩陣數據的主成分分析方法,其特征在于,所述S1,進一步包括:
S11:根據隨機數生成器軟件生成一個n×l隨機數矩陣Ω;
S12:初始化變量i=0,變量P為小于10的非負整數;
S13:如果i=P,則結束執行,否則轉到所述S14繼續執行;
S14:計算矩陣乘法AΩ,并對計算結果進行簡化QR分解,將得到的m×l列正交陣賦值給矩陣G;
S15:計算矩陣乘法ATG,并對計算結果進行簡化QR分解,將得到的n×l列正交陣賦值給矩陣Ω;
S16:將i的值加1,并轉到所述S13繼續執行。
4.根據權利要求1所述的處理大規模矩陣數據的主成分分析方法,其特征在于,在所述S2中,根據所述原始數據矩陣A的不同產生方式或來源,通過遍歷一遍所述原始數據矩陣A中的元素來計算出矩陣G=AΩ和H=ATG。
5.根據權利要求1所述的處理大規模矩陣數據的主成分分析方法,其特征在于,所述S2,進一步包括:
S21:在內存中開辟二維數組空間存儲n×l的矩陣H,并將所述矩陣H的數據初始化為0;
S22:獲取原始數據矩陣A的預設行的數據并存于內存中,并設定所述預設行形成s×n的矩陣Ai,計算矩陣乘運算Gi=AiΩ,其中,所述Gi為矩陣G對應的行;
S23:計算并將計算結果賦值給矩陣H;
S24:判斷是否獲取原始數據矩陣A的所有行,如果是,則停止執行,否則返回執行所述S22。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于清華大學,未經清華大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201611153472.6/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用
- 數據顯示系統、數據中繼設備、數據中繼方法、數據系統、接收設備和數據讀取方法
- 數據記錄方法、數據記錄裝置、數據記錄媒體、數據重播方法和數據重播裝置
- 數據發送方法、數據發送系統、數據發送裝置以及數據結構
- 數據顯示系統、數據中繼設備、數據中繼方法及數據系統
- 數據嵌入裝置、數據嵌入方法、數據提取裝置及數據提取方法
- 數據管理裝置、數據編輯裝置、數據閱覽裝置、數據管理方法、數據編輯方法以及數據閱覽方法
- 數據發送和數據接收設備、數據發送和數據接收方法
- 數據發送裝置、數據接收裝置、數據收發系統、數據發送方法、數據接收方法和數據收發方法
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置
- 數據發送方法、數據再現方法、數據發送裝置及數據再現裝置





