[發明專利]一種基于預后信息與強化學習的蛋白質組學分子分型方法有效
| 申請號: | 202210162480.6 | 申請日: | 2022-02-22 |
| 公開(公告)號: | CN114694748B | 公開(公告)日: | 2022-10-28 |
| 發明(設計)人: | 賀福初;謝林海;常乘 | 申請(專利權)人: | 中國人民解放軍軍事科學院軍事醫學研究院 |
| 主分類號: | G16B20/00 | 分類號: | G16B20/00;G06N3/04;G06N3/08 |
| 代理公司: | 北京君尚知識產權代理有限公司 11200 | 代理人: | 司立彬 |
| 地址: | 100850*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 預后 信息 強化 學習 蛋白質 分子 方法 | ||
本發明公開了一種基于預后信息與強化學習的蛋白質組學分子分型方法,其步驟包括:1)獲取發現隊列與驗證隊列數據中的共鑒定蛋白,將共鑒定蛋白與發現隊列所對應數據中的差異表達蛋白的交集分別作為發現隊列、驗證隊列的蛋白質表達矩陣的特征,得到發現隊列的蛋白質表達矩陣Xs、驗證隊列的蛋白質表達矩陣Xt;3)構建深度神經網絡模型,包括分類器與增強學習獎勵基線估計器;4)利用蛋白質表達矩陣Xs及對應的分類標簽、蛋白質表達矩陣Xt及對應的預后信息,訓練深度神經網絡模型;5)將待處理蛋白質組數據輸入訓練后的分類器,得到其分子亞型。本發明既能有效保證帶拓展分子分型在驗證集上的預后區分度,又規避了對分類器模型的過度依賴。
技術領域
本發明涉及臨床蛋白質組學的患者預后分層問題,特別是將一種已知具有預后區分能力的蛋白質組分子分型從發現隊列拓展到其他驗證隊列上。同時本發明也涉及了機器學習中的半監督式學習技術,特別是有標簽數據與無標簽數據存在差異性的領域自適應技術。
背景技術
基于分子特征對病人進行預后分層是組學研究在臨床醫學中的重要應用之一。一種新的分子分型從提出到投入臨床應用需要經過多個中心的獨立人群驗證。由于基因組和轉錄組數據在各人群測得的數據一致性比較高,因此基于基因組和轉錄組數據做多中心的驗證比較簡單直接。僅通過無監督式聚類或者監督式分類,便可在驗證隊列中得到與發現隊列中分型有較高一致性的各亞型。對于存在批次效應的多個隊列,可通過已有算法消除批次效應,然后進行驗證。然而,有別于基因組與轉錄組數據,蛋白質組數據在不同樣本處理方法、檢測方式以及人群中存在較大異質性,導致單一隊列發現的分子分型難以拓展到多個臨床隊列,且通過目前的去批次效應算法無法有效消除該異質性。除此之外,去批次效應算法在消除批次效應影響的同時還存在部分消除生物學差異的風險。
在機器學習領域中上述問題可被描述為無監督領域自適應分類問題,是半監督分類任務中的子任務。目前,領域自適應算法主要被應用在圖像數據上,其效果很大程度上依賴于卷積深度神經網絡對圖像數據關鍵特征的提取能力。由于目前尚未發現適用于蛋白質組學數據的深度神經網絡結構,故現有成熟的領域自適應算法無法有效解決蛋白質組學中的相應問題。
發明內容
針對現有技術存在的技術問題,本發明的目的是提供一種基于預后信息與強化學習的蛋白質組學分子分型方法。本發明以預后信息為引導,通過監督式學習與強化學習,將已知具有預后區分能力的分子分型從發現隊列遷移到具有異質性數據的驗證隊列中。
本發明的技術方案為:
一種基于預后信息與強化學習的蛋白質組學分子分型方法,其步驟包括:
1)獲取發現隊列與驗證隊列數據中的共鑒定蛋白,將所述共鑒定蛋白與所述發現隊列所對應數據中的差異表達蛋白的交集分別作為所述發現隊列、驗證隊列的蛋白質表達矩陣的特征,得到所述發現隊列的蛋白質表達矩陣所述驗證隊列的蛋白質表達矩陣其中,所述發現隊列為提出分子分型的測試者隊列,所述驗證隊列為驗證所述分子分型的測試者隊列,ns為發現隊列的樣本數量,nt為驗證隊列的樣本數量,d為蛋白數量;
2)構建深度神經網絡模型,所述深度神經網絡模型包括分類器與增強學習獎勵基線估計器;
3)利用所述發現隊列的蛋白質表達矩陣及對應的分類標簽、所述驗證隊列的蛋白質表達矩陣及對應的預后信息,訓練所述深度神經網絡模型;
4)將待處理蛋白質組數據輸入訓練后的分類器,得到其分子亞型。
進一步的,所述發現隊列對應的數據包括蛋白質表達矩陣樣本的分子分型標簽其中ds表示發現隊列的蛋白數量,nc為亞型數量;所述驗證隊列對應的數據包括蛋白質表達矩陣與樣本的預后信息,其中dt表示驗證隊列的蛋白數量;獲到蛋白質表達矩陣蛋白質表達矩陣的方法為:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國人民解放軍軍事科學院軍事醫學研究院,未經中國人民解放軍軍事科學院軍事醫學研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210162480.6/2.html,轉載請聲明來源鉆瓜專利網。
- 信息記錄介質、信息記錄方法、信息記錄設備、信息再現方法和信息再現設備
- 信息記錄裝置、信息記錄方法、信息記錄介質、信息復制裝置和信息復制方法
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄裝置、信息再現裝置、信息記錄方法、信息再現方法、信息記錄程序、信息再現程序、以及信息記錄介質
- 信息記錄設備、信息重放設備、信息記錄方法、信息重放方法、以及信息記錄介質
- 信息存儲介質、信息記錄方法、信息重放方法、信息記錄設備、以及信息重放設備
- 信息存儲介質、信息記錄方法、信息回放方法、信息記錄設備和信息回放設備
- 信息記錄介質、信息記錄方法、信息記錄裝置、信息再現方法和信息再現裝置
- 信息終端,信息終端的信息呈現方法和信息呈現程序
- 信息創建、信息發送方法及信息創建、信息發送裝置





