[發(fā)明專利]一種基于偏最小二乘法的生物特征標記物提取方法及系統(tǒng)有效
| 申請?zhí)枺?/td> | 201710476396.0 | 申請日: | 2017-06-21 |
| 公開(公告)號: | CN107203497B | 公開(公告)日: | 2021-03-16 |
| 發(fā)明(設(shè)計)人: | 歐陽永中;劉俊文 | 申請(專利權(quán))人: | 佛山科學(xué)技術(shù)學(xué)院 |
| 主分類號: | G06F17/18 | 分類號: | G06F17/18;G01N27/62 |
| 代理公司: | 北京睿智保誠專利代理事務(wù)所(普通合伙) 11732 | 代理人: | 周新楣 |
| 地址: | 528000 廣*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 最小二乘法 生物 特征 標記 提取 方法 系統(tǒng) | ||
1.一種基于偏最小二乘法的生物特征標記物提取方法,其特征在于,包括以下步驟:
對待提取樣本進行質(zhì)譜分析,獲得待提取樣本的質(zhì)譜數(shù)據(jù);
采用偏最小二乘法對待提取樣本進行建模及特征提取;
所述對待提取樣本進行質(zhì)譜分析,獲得待提取樣本的質(zhì)譜數(shù)據(jù)這一步驟,具體為:
計算待提取樣本的質(zhì)核比并分析待提取樣本的類別,獲得待提取樣本的質(zhì)譜數(shù)據(jù);
所述采用偏最小二乘法對待提取樣本進行建模及特征提取這一步驟,包括以下步驟:
獲取待提取樣本的質(zhì)核比和類別,將待提取樣本的質(zhì)核比設(shè)為自變量,將待提取樣本的類別設(shè)為因變量;
對自變量和因變量進行標準化處理;
獲取標準化處理后的自變量和因變量,采用偏最小二乘法,提取待提取樣本的特征數(shù)據(jù);
所述獲取標準化后的自變量和因變量,采用偏最小二乘法,提取待提取樣本的特征數(shù)據(jù)這一步驟,包括以下步驟:
根據(jù)標準化處理后的自變量和因變量,進行主成分提取;
判斷主成分提取得到的主成分是否滿足設(shè)定精度要求,若是,則結(jié)束主成分提取操作并執(zhí)行下一步驟的操作;反之,則返回根據(jù)標準化后的自變量和因變量,進行主成分提取這一步驟,直至提取到的主成分滿足設(shè)定精度要求;
根據(jù)滿足設(shè)定精度要求的主成分,對待提取樣本進行特征提??;
所述根據(jù)滿足設(shè)定精度要求的主成分,對待提取樣本進行特征提取這一步驟,包括以下步驟:
獲取滿足設(shè)定精度要求的主成分,計算待提取樣本的負荷向量;
根據(jù)待提取樣本的負荷向量,計算待提取樣本的載荷矩陣;
根據(jù)待提取樣本的載荷矩陣,進行待提取樣本特征標志物的提??;
提取滿足設(shè)定精度要求的主成分的具體過程為:
設(shè)自變量的標準矩陣為E0,設(shè)因變量的標準矩陣為F0;
根據(jù)E0和F0計算權(quán)值向量,并將計算結(jié)果進行歸一化得到權(quán)值向量w1,所述權(quán)值向量計算公式為:w1T=F0TE0/(F0TF0),歸一公式為:w1=w1/‖w1‖,其中‖w1‖為w1的模值;
根據(jù)權(quán)值向量w1計算得分向量t1,所述得分向量計算公式為:t1=E0w1;
根據(jù)得分向量t1計算負荷向量p1,所述負荷向量計算公式為:p1T=t1TE0/(t1Tt1);
根據(jù)負荷向量p1提取生物樣本數(shù)據(jù)的第一主成分;
其中,記T=[t1,tn]為得分矩陣,即樣本的主成分矩陣;P=[p1,pn]為載荷矩陣;W=[w1,wn]為系數(shù)矩陣,則第一主成分的計算公式為:T1=E0W(PTW)-1;
其他主成分的計算方法與上述第一主成分的計算方法相同;
所述滿足設(shè)定精度要求的主成分與因變量的相關(guān)度最大,滿足設(shè)定精度要求的主成分t1與因變量F0的相關(guān)系數(shù)算子r(t1,F(xiàn)0)取值最大,即:r(t1,F(xiàn)0)→max;
所述主成分還存儲了自變量和因變量之間的最大差異信息,自變量和因變量之間的最大差異信息通過主成分t1的最大方差var(t1)來進行表征,即:var(t1)→max。
2.一種基于偏最小二乘法的生物特征標記物提取系統(tǒng),其特征在于,包括:
質(zhì)譜分析子系統(tǒng),用于對待提取樣本進行質(zhì)譜分析,獲得待提取樣本的質(zhì)譜數(shù)據(jù);
特征提取子系統(tǒng),用于采用偏最小二乘法對待提取樣本進行建模及特征提??;
所述特征提取子系統(tǒng),包括:
獲取模塊,用于獲取待提取樣本的質(zhì)核比和類別,將待提取樣本的質(zhì)核比設(shè)為自變量,將待提取樣本的類別設(shè)為因變量;
標準化處理模塊,用于對自變量和因變量進行標準化處理;
特征提取模塊,用于獲取標準化處理后的自變量和因變量,采用偏最小二乘法,提取待提取樣本的特征數(shù)據(jù);
所述特征提取模塊,包括:
主成分提取單元,用于根據(jù)標準化處理后的自變量和因變量,進行主成分提??;
回歸處理單元,用于判斷主成分提取得到的主成分是否滿足設(shè)定精度要求,若是,則結(jié)束主成分提取操作并執(zhí)行下一步驟的操作;反之,則返回根據(jù)標準化后的自變量和因變量,進行主成分提取這一步驟,直至提取到的主成分滿足設(shè)定精度要求;
特征提取單元,用于根據(jù)滿足設(shè)定精度要求的主成分,對待提取樣本進行特征提取;
所述特征提取單元,包括:
負荷向量計算子單元,用于獲取滿足設(shè)定精度要求的主成分,計算待提取樣本的負荷向量;
載荷矩陣計算子單元,用于根據(jù)待提取樣本的負荷向量,計算待提取樣本的載荷矩陣;
特征提取子單元,用于根據(jù)待提取樣本的載荷矩陣,進行待提取樣本特征標志物的提?。?/p>
提取滿足設(shè)定精度要求的主成分的具體過程為:
設(shè)自變量的標準矩陣為E0,設(shè)因變量的標準矩陣為F0;
根據(jù)E0和F0計算權(quán)值向量,并將計算結(jié)果進行歸一化得到權(quán)值向量w1,所述權(quán)值向量計算公式為:w1T=F0TE0/(F0TF0),歸一公式為:w1=w1/‖w1‖,其中‖w1‖為w1的模值;
根據(jù)權(quán)值向量w1計算得分向量t1,所述得分向量計算公式為:t1=E0w1;
根據(jù)得分向量t1計算負荷向量p1,所述負荷向量計算公式為:p1T=t1TE0/(t1Tt1);
根據(jù)負荷向量p1提取生物樣本數(shù)據(jù)的第一主成分;
其中,記T=[t1,tn]為得分矩陣,即樣本的主成分矩陣;P=[p1,pn]為載荷矩陣;W=[w1,wn]為系數(shù)矩陣,則第一主成分的計算公式為:T1=E0W(PTW)-1;
其他主成分的計算方法與上述第一主成分的計算方法相同;
滿足設(shè)定精度要求的主成分t1與因變量F0的相關(guān)系數(shù)算子r(t1,F(xiàn)0)取值最大,即:r(t1,F(xiàn)0)→max;
所述主成分還存儲了自變量和因變量之間的最大差異信息,自變量和因變量之間的最大差異信息通過主成分t1的最大方差var(t1)來進行表征,即:var(t1)→max。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于佛山科學(xué)技術(shù)學(xué)院,未經(jīng)佛山科學(xué)技術(shù)學(xué)院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710476396.0/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





