[發(fā)明專利]一種基于預(yù)后信息與強化學習的蛋白質(zhì)組學分子分型方法有效
| 申請?zhí)枺?/td> | 202210162480.6 | 申請日: | 2022-02-22 |
| 公開(公告)號: | CN114694748B | 公開(公告)日: | 2022-10-28 |
| 發(fā)明(設(shè)計)人: | 賀福初;謝林海;常乘 | 申請(專利權(quán))人: | 中國人民解放軍軍事科學院軍事醫(yī)學研究院 |
| 主分類號: | G16B20/00 | 分類號: | G16B20/00;G06N3/04;G06N3/08 |
| 代理公司: | 北京君尚知識產(chǎn)權(quán)代理有限公司 11200 | 代理人: | 司立彬 |
| 地址: | 100850*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 預(yù)后 信息 強化 學習 蛋白質(zhì) 分子 方法 | ||
1.一種基于預(yù)后信息與強化學習的蛋白質(zhì)組學分子分型方法,其步驟包括:
1)獲取發(fā)現(xiàn)隊列與驗證隊列數(shù)據(jù)中的共鑒定蛋白,將所述共鑒定蛋白與所述發(fā)現(xiàn)隊列所對應(yīng)數(shù)據(jù)中的差異表達蛋白的交集分別作為所述發(fā)現(xiàn)隊列、驗證隊列的蛋白質(zhì)表達矩陣的特征,得到所述發(fā)現(xiàn)隊列的蛋白質(zhì)表達矩陣所述驗證隊列的蛋白質(zhì)表達矩陣其中,所述發(fā)現(xiàn)隊列為提出分子分型的測試者隊列,所述驗證隊列為驗證所述分子分型的測試者隊列,ns為發(fā)現(xiàn)隊列的樣本數(shù)量,nt為驗證隊列的樣本數(shù)量,d為蛋白數(shù)量;
2)構(gòu)建深度神經(jīng)網(wǎng)絡(luò)模型,所述深度神經(jīng)網(wǎng)絡(luò)模型包括分類器與增強學習獎勵基線估計器;
3)利用所述發(fā)現(xiàn)隊列的蛋白質(zhì)表達矩陣及對應(yīng)的分類標簽、所述驗證隊列的蛋白質(zhì)表達矩陣及對應(yīng)的預(yù)后信息,訓練所述深度神經(jīng)網(wǎng)絡(luò)模型;
4)將待處理蛋白質(zhì)組數(shù)據(jù)輸入訓練后的分類器,得到其分子亞型。
2.根據(jù)權(quán)利要求1所述的方法,其特征在于,所述發(fā)現(xiàn)隊列對應(yīng)的數(shù)據(jù)包括蛋白質(zhì)表達矩陣樣本的分子分型標簽其中ds表示發(fā)現(xiàn)隊列的蛋白數(shù)量,nc為亞型數(shù)量;所述驗證隊列對應(yīng)的數(shù)據(jù)包括蛋白質(zhì)表達矩陣與樣本的預(yù)后信息,其中dt表示驗證隊列的蛋白數(shù)量;獲到蛋白質(zhì)表達矩陣蛋白質(zhì)表達矩陣的方法為:
11)分別對蛋白質(zhì)表達矩陣Xs′、Xt′的樣本進行概率分布歸一化處理;
12)刪除蛋白質(zhì)表達矩陣Xs′、Xt′中缺失率超過設(shè)定比例的蛋白;
13)將蛋白質(zhì)表達矩陣Xs′、Xt′中的缺失值填補為0;
14)取發(fā)現(xiàn)隊列與驗證隊列數(shù)據(jù)中的共鑒定蛋白,將所述共鑒定蛋白與所述發(fā)現(xiàn)隊列所對應(yīng)數(shù)據(jù)中的差異表達蛋白的交集分別作為所述發(fā)現(xiàn)隊列、驗證隊列的蛋白質(zhì)表達矩陣的特征,得到所述發(fā)現(xiàn)隊列的蛋白質(zhì)表達矩陣所述驗證隊列的蛋白質(zhì)表達矩陣
3.根據(jù)權(quán)利要求2所述的方法,其特征在于,所述預(yù)后信息包括總體生存時間os與是否死亡dead、無復(fù)發(fā)生存時間rfs與是否復(fù)發(fā)recur。
4.根據(jù)權(quán)利要求1或2或3所述的方法,其特征在于,訓練所述深度神經(jīng)網(wǎng)絡(luò)模型的方法為:
31)將所述蛋白質(zhì)表達矩陣Xs輸入所述分類器,預(yù)測得到所述蛋白質(zhì)表達矩陣Xs中每一樣本對應(yīng)的預(yù)測標簽,然后通過最小化預(yù)測標簽與分類標簽之間的交叉熵LCE優(yōu)化所述分類器;
32)將所述蛋白質(zhì)表達矩陣Xt輸入所述分類器,預(yù)測得到所述蛋白質(zhì)表達矩陣Xt中每個樣本屬于各個亞型的概率Pt;將所述概率Pt作為多項式分布的參數(shù),在該多項式分布中進行隨機采樣,作為每個樣本的分類結(jié)果;
33)根據(jù)步驟32)所得每個樣本的分類結(jié)果與對應(yīng)的預(yù)后信息,計算得到各亞型在各設(shè)定臨床事件下的限制平均生存時間RMST;在每個臨床事件中,將各亞型之間的限制預(yù)后時間差的最小值作為對應(yīng)臨床事件的獎勵值;
34)將所述蛋白質(zhì)表達矩陣Xt輸入獎勵基線估計器,預(yù)測得到獎勵基線bt;
35)根據(jù)若干臨床事件的獎勵值計算一綜合獎勵值r,將綜合獎勵值r減去所述獎勵基線bt作為最終獎勵R,通過策略梯度算法最大化最終獎勵R優(yōu)化所述分類器;同時通過最小化基線損失函數(shù)LBL優(yōu)化獎勵基線估計器。
5.根據(jù)權(quán)利要求4所述的方法,其特征在于,通過策略梯度算法最大化最終獎勵R優(yōu)化所述分類器時所采用的目標函數(shù)為其中,表示標簽矩陣Yt中第i行第j列的元素,為驗證隊列對應(yīng)的預(yù)測概率矩陣Pt中第i行第j列的元素。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國人民解放軍軍事科學院軍事醫(yī)學研究院,未經(jīng)中國人民解放軍軍事科學院軍事醫(yī)學研究院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210162480.6/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 肝癌預(yù)后標記物
- 預(yù)測肝癌預(yù)后的組合物或試劑盒以及預(yù)測肝癌預(yù)后的方法
- 基于證據(jù)的胃癌預(yù)后分子標記物篩選方法
- DPEP1在作為評估成人B-ALL患者預(yù)后風險標記物中的應(yīng)用
- tRNA相關(guān)肺腺癌預(yù)后模型及其應(yīng)用
- 一種對非小細胞肺癌預(yù)后生存情況的分析方法
- 預(yù)測胃腺癌患者預(yù)后的診斷生物標記物及其確定方法、應(yīng)用
- 結(jié)外鼻型NK/T細胞淋巴瘤預(yù)后標志物及其應(yīng)用和預(yù)后預(yù)測模型及其構(gòu)建方法
- 基于m6A相關(guān)的IncRNA網(wǎng)絡(luò)胃癌預(yù)后的模型構(gòu)建及臨床應(yīng)用
- 一種胰腺癌的預(yù)后標志物、預(yù)后風險評估模型及其應(yīng)用
- 信息記錄介質(zhì)、信息記錄方法、信息記錄設(shè)備、信息再現(xiàn)方法和信息再現(xiàn)設(shè)備
- 信息記錄裝置、信息記錄方法、信息記錄介質(zhì)、信息復(fù)制裝置和信息復(fù)制方法
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄裝置、信息再現(xiàn)裝置、信息記錄方法、信息再現(xiàn)方法、信息記錄程序、信息再現(xiàn)程序、以及信息記錄介質(zhì)
- 信息記錄設(shè)備、信息重放設(shè)備、信息記錄方法、信息重放方法、以及信息記錄介質(zhì)
- 信息存儲介質(zhì)、信息記錄方法、信息重放方法、信息記錄設(shè)備、以及信息重放設(shè)備
- 信息存儲介質(zhì)、信息記錄方法、信息回放方法、信息記錄設(shè)備和信息回放設(shè)備
- 信息記錄介質(zhì)、信息記錄方法、信息記錄裝置、信息再現(xiàn)方法和信息再現(xiàn)裝置
- 信息終端,信息終端的信息呈現(xiàn)方法和信息呈現(xiàn)程序
- 信息創(chuàng)建、信息發(fā)送方法及信息創(chuàng)建、信息發(fā)送裝置





