[發(fā)明專利]一種基于多基因表達特征譜的胰腺癌個性化預后評估方法有效
| 申請?zhí)枺?/td> | 201810440131.X | 申請日: | 2018-05-09 |
| 公開(公告)號: | CN108648826B | 公開(公告)日: | 2022-04-15 |
| 發(fā)明(設(shè)計)人: | 李功華;李文興;黃京飛;趙旭東;代紹興 | 申請(專利權(quán))人: | 中國科學院昆明動物研究所 |
| 主分類號: | G16H50/30 | 分類號: | G16H50/30;G16B40/00;G16B5/00;G16B20/00 |
| 代理公司: | 北京權(quán)智天下知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11638 | 代理人: | 王新愛 |
| 地址: | 650000 云*** | 國省代碼: | 云南;53 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 多基因 表達 特征 胰腺癌 個性化 預后 評估 方法 | ||
1.一種基于多基因表達特征譜的胰腺癌個性化預后評估方法,其特征在于,包括以下步驟:
步驟1、獲取胰腺癌預后風險基因列表與基因權(quán)重;
步驟2、利用胰腺癌患者腫瘤組織轉(zhuǎn)錄組和生存數(shù)據(jù)構(gòu)建預后評估模型;
步驟3、根據(jù)胰腺癌患者腫瘤組織的基因表達譜計算患者的風險得分;
步驟4、根據(jù)患者的風險得分計算患者每年的生存概率;
所述步驟1中的獲取胰腺癌預后風險基因列表與基因權(quán)重具體為:
步驟1.1、從Genomic Data Commons Data Portal數(shù)據(jù)庫中下載胰腺癌患者腫瘤組織和癌旁組織轉(zhuǎn)錄組數(shù)據(jù)以及臨床數(shù)據(jù),獲得胰腺癌患者腫瘤組織基因表達譜FPKM數(shù)值,進行對數(shù)轉(zhuǎn)換;
步驟1.2、設(shè)總樣本數(shù)為m,將所有樣本根據(jù)其基因表達值的三分位數(shù)分為三組,其中,基因表達值具體是指步驟1.1中獲得的FPKM數(shù)值,用V表示,對第i個基因記為Vi,利用Cox比例風險模型計算第三分組相比第一分組的生存風險,得出第i個基因的風險比HRi和P值,即得出每一個基因的風險比;定義P值0.05具有顯著性,篩選具有顯著性的生存風險基因,記為N1;此外,計算每個基因與患者生存天數(shù)的相關(guān)性,得出每個基因的相關(guān)系數(shù)r和P值;定義P值0.05具有顯著性,篩選具有顯著性的生存相關(guān)基因,記為N2;將生存風險基因和生存相關(guān)基因的交集定義為預后風險基因,記為N,則有:
N=N1∩N2 (1)
步驟1.3、根據(jù)第i個基因的風險比計算第i個基因的權(quán)重Wi,計算公式為:
這樣就能得出每一個基因的權(quán)重,最終得到的胰腺癌預后風險基因列表與基因權(quán)重;
所述胰腺癌預后風險基因列表與基因權(quán)重如下表所示:
所述步驟2中的利用胰腺癌患者腫瘤組織轉(zhuǎn)錄組和生存數(shù)據(jù)構(gòu)建預后評估模型,具體為:
步驟2.1、定義基因表達值為V,根據(jù)第i個基因在第j個樣本中的表達值和權(quán)重計算第i個患者的風險得分Sj;計算公式為:
其中,j表示樣本編號,m表示樣本總數(shù),Vij表示第i個基因在第j個樣本中的表達值;
步驟2.2、將所有胰腺癌患者樣本按照風險得分從低到高排序,使用滑動窗口模型對每50個樣本計算平均風險得分計算公式為:
其中j+49表示從樣本j開始計數(shù)的后50個樣本;
步驟2.3、使用Weibull分布對50個樣本的生存數(shù)據(jù)進行曲線擬合,Weibull分布的概率密度函數(shù)為:
其中k>0是形狀參數(shù),λ>0是分布的比例參數(shù);
步驟2.4、對每50個樣本計算出所對應的kj和λj;kj為一個固定的數(shù)值,均值為:
其中,kj為第j個樣本到第j+49個樣本生存曲線Weibull分布的形狀參數(shù);
定義λj與的函數(shù)關(guān)系為:
其中,λj表示第j個樣本到第j+49個樣本生存曲線Weibull分布的比例參數(shù);
其中e為自然對數(shù)的底,α、β為函數(shù)的參數(shù),對上式取對數(shù)得:
其中l(wèi)ogλj與為線性關(guān)系,通過線性擬合求解;
根據(jù)平均風險得分與Weibull分布參數(shù)λj的擬合曲線,得出的函數(shù)關(guān)系為:
將代入該函數(shù)得出預測的λj′,λj′為用該函數(shù)計算出的預期分布參數(shù),計算λj與λj′的相關(guān)性得相關(guān)系數(shù)R2=0.978,P值=1.48E-39;
所述步驟3中的根據(jù)胰腺癌患者腫瘤組織的基因表達譜計算患者的風險得分,具體為:獲取胰腺癌患者腫瘤組織的第i個基因表達譜的FPKM數(shù)值,記為:Vi;第i個基因?qū)臋?quán)重記為:Wi;患者風險得分記為:S;計算公式為:
其中i為基因編號,n為基因個數(shù);
所述步驟4中的根據(jù)患者的風險得分計算患者每年的生存概率,具體為:將患者的風險得分S帶入Weibull分布的累積分布函數(shù)得出該患者的存活概率函數(shù)為:
其中t為時間,α、β、S、均為固定參數(shù)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國科學院昆明動物研究所,未經(jīng)中國科學院昆明動物研究所許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810440131.X/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





