[發明專利]用于結直腸癌預后風險預測的生物標志物、模型及其應用在審
| 申請號: | 202211356031.1 | 申請日: | 2022-11-01 |
| 公開(公告)號: | CN116030880A | 公開(公告)日: | 2023-04-28 |
| 發明(設計)人: | 齊鑫;趙園春;閆東輝;左嘉晨;張元辰 | 申請(專利權)人: | 蘇州科技大學 |
| 主分類號: | G16B5/20 | 分類號: | G16B5/20;G16B40/00;G16B50/30 |
| 代理公司: | 蘇州市中南偉業知識產權代理事務所(普通合伙) 32257 | 代理人: | 李柏柏 |
| 地址: | 215000 江*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 用于 直腸癌 預后 風險 預測 生物 標志 模型 及其 應用 | ||
1.一種結直腸癌預后風險預測模型,其特征在于:該預后風險預測模型通過以下步驟構建:
S1:從GEO和TCGA數據庫獲取結直腸癌患者的表達譜數據和臨床信息數據,這兩種數據用于預后風險預測模型的構建與驗證,數據包括訓練集和驗證集,同時從GEO數據庫獲取癌癥組織樣本和正常對照組織樣本的表達譜數據;
S2:將癌癥組織樣本和正常對照組織樣本標準化后的基因表達矩陣進行差異表達分析,得到差異表達基因;
S3:將差異表達基因在訓練集中進行單因素Cox回歸和PH檢驗分析,篩選出預后相關基因;
S4:對篩選得到的基因進行LASSOCox回歸分析,通過交叉驗證確定最優的λ值,篩選出組成預后風險預測模型的基因,并根據篩選出來的每個基因的回歸系數和其在訓練集和驗證集中的標準化后的表達水平計算每個數據集中各患者的風險評分;
S5:根據所述風險評分評估所述預后風險預測模型的預測性能。
2.根據權利要求1所述的一種結直腸癌預后風險預測模型,其特征在于:在S3中,將差異表達基因在訓練集中進行單因素Cox回歸和PH檢驗分析,篩選出預后相關基因的方法包括:
刪除訓練集預后信息中缺失總體生存時間和生存結局的樣本;
在單因素Cox回歸分析中,將差異表達基因在訓練集中標準化的基因表達矩陣、樣本的總體生存時間和生存結局信息作為輸入文件進行單因素Cox回歸分析,篩選出滿足PH回歸假設且p值小于設定值的與樣本預后時間顯著相關的基因。
3.根據權利要求1所述的一種結直腸癌預后風險預測模型,其特征在于:在S4中,所述預后風險預測模型所含的基因包括INHBA、GALNT6、ZNF239、PDE6A、PTPRR、HSD17B2、CD177、CDKN2B、MALL、LGALS2、BTNL8、SCG2和PCOLCE2。
4.根據權利要求3所述的一種結直腸癌預后風險預測模型,其特征在于:所述基因INHBA、GALNT6、ZNF239、PDE6A、PTPRR、HSD17B2、CD177、CDKN2B、MALL、LGALS2、BTNL8、SCG2和PCOLCE2對應的回歸系數分別為0.008048177、-0.014590776、0.169851027、-0.141714084、0.080175473、0.286836794、-0.115094672、0.070682084、0.044238906、-0.16681854、-0.071504884、0.281751541和0.070570821。
5.根據權利要求1或4所述的一種結直腸癌預后風險預測模型,其特征在于:在S4中,所述風險評分的計算公式為:
其中,Coef表示模型中每個基因的回歸系數,E表示模型中每個基因標準化后的表達水平,i表示模型中基因的索引,n表示模型中包含的基因數量。
6.根據權利要求1所述的一種結直腸癌預后風險預測模型,其特征在于:在S5中,根據所述風險評分評估所述預后風險預測模型的預測性能的方法包括:
以驗證集和訓練集的風險評分和臨床指標作為變量進行多因素Cox回歸分析,判斷基于預后風險預測模型的風險評分是否能夠作為結直腸癌的獨立預后因子,同時根據風險評分進行KM生存曲線、時間依賴性的ROC曲線分析,評估該預后風險預測模型對結直腸癌患者總體生存時間的預測性能。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州科技大學,未經蘇州科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211356031.1/1.html,轉載請聲明來源鉆瓜專利網。





