[發明專利]構建骨髓增生異常綜合征轉白基因預測模型的方法有效
| 申請號: | 202111009309.3 | 申請日: | 2021-08-31 |
| 公開(公告)號: | CN113764038B | 公開(公告)日: | 2023-08-22 |
| 發明(設計)人: | 侯珺;杜欣;孫啟慧 | 申請(專利權)人: | 華南理工大學 |
| 主分類號: | G16B20/50 | 分類號: | G16B20/50;G16B20/20;G06F18/214;G06F18/2411 |
| 代理公司: | 廣州市華學知識產權代理有限公司 44245 | 代理人: | 郭煒綿 |
| 地址: | 510640 廣*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 構建 骨髓 增生 異常 綜合征 基因 預測 模型 方法 | ||
1.一種構建骨髓增生異常綜合征轉白基因預測模型的方法,其特征在于包括以下步驟:
(1)收集高危MDS患者的樣本及其預后數據;提取樣本DNA并測序,獲得突變譜;將高危MDS患者的樣本作為訓練樣本;
(2)利用R包maftools中oncodriveCLUST函數和R包dndscv函數,將步驟(1)獲得的突變譜與現有高危MDS患者DNA測序數據庫比對,將兩種方法都比對到的基因定義為高危MDS組驅動基因;
(3)將訓練樣本中的高危MDS組驅動基因選取出,并且進行突變標記,當存在突變時標記為A1,不存在突變時標記為A2;以各訓練樣本的高危MDS組驅動基因突變標記作為輸入,對SVM分類器模型進行訓練,完成模型的構建;獲取高危MDS組驅動基因后,利用Lasso多重回歸方法得到Bonferroni校正后與白血病轉化顯著相關的突變基因,建立改進的wGRS模型;
wGRS=β1S1+β2S2+,…,+βnSn+a;
a為常數;S1至Sn為與白血病轉化顯著相關的各突變基因,β1至βn為對應權重;
根據改進的wGRS模型進行轉白風險預測,預測得分0.5為高風險轉白,預測得分≥0.5為低風險轉白;
步驟(3)中,A1為1,A2為0,或者A1為1,A2為0;SVM分類器模型選取0.5為閾值對樣本進行預測,當樣本預測值≥0.5,預測該樣本為高風險轉白;當樣本預測值0.5,預測該樣本為低風險轉白。
2.根據權利要求1所述的方法,其特征在于:步驟(2)所述的高危MDS組驅動基因為CBL、EZH2、RUNX1、IDH1、ASXL1、TET2、TP53、SRSF2、IDH2和JAK2。
3.根據權利要求1所述的方法,其特征在于:所述步驟(3)中,通過sample函數隨機從入組高危MDS組樣本中選取70%患者作為訓練集,將其驅動基因的突變標記作為輸入,對SVM分類器模型進行訓練,再用剩余30%樣本的預測值進行驗證。
4.根據權利要求1所述的方法,其特征在于:所述與白血病轉化顯著相關的突變基因為:CBL、EZH2、IDH1和TP53;
所述改進的wGRS模型為:
wGRS=-0.3459*CBL-0.1989*EZH2-0.2663*IDH1+0.2174*TP53+0.5996。
5.根據權利要求1-4任一項所述的方法,其特征在于:針對各訓練樣本,提取出臨床信息,在訓練時,將訓練樣本的高危MDS組驅動基因突變與臨床信息融合后作為輸入,對SVM分類器模型進行訓練。
6.根據權利要求5所述的方法,其特征在于:所述的臨床信息包括原始細胞數、血細胞計數、細胞遺傳學異常指標。
7.根據權利要求1所述的方法,其特征在于:步驟(1)所述的樣本為骨髓穿刺樣品、血液,或其他組織。
8.根據權利要求1所述的方法,其特征在于:步驟(1)所述的突變包括錯義突變、無義突變、框移插入、框移缺失、非框移插入、非框移缺失及剪切位點突變,排除內含子變異及同義突變。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華南理工大學,未經華南理工大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202111009309.3/1.html,轉載請聲明來源鉆瓜專利網。





