[發明專利]一種鼻咽癌分子分型的預測系統有效
申請號: | 202110362236.X | 申請日: | 2021-04-02 |
公開(公告)號: | CN113096730B | 公開(公告)日: | 2022-02-25 |
發明(設計)人: | 陳明遠;林美 | 申請(專利權)人: | 中山大學 |
主分類號: | G16B25/10 | 分類號: | G16B25/10;G16B30/10;G16B40/00 |
代理公司: | 廣州長星專利商標代理事務所(普通合伙) 44662 | 代理人: | 梁桂萍 |
地址: | 510000 廣*** | 國省代碼: | 廣東;44 |
權利要求書: | 查看更多 | 說明書: | 查看更多 |
摘要: | |||
搜索關鍵詞: | 一種 鼻咽癌 分子 預測 系統 | ||
1.一種鼻咽癌分子分型的預測系統,其特征在于,所述的預測系統工作時包括以下步驟:
S1、收集X例鼻咽癌轉錄組表達矩陣及臨床數據;
S2、提取鼻咽癌I型、II型、III型三種不同分子亞型基因表達特征,I、II、III型病例數目分別為a、b、c個,且步驟S1的X=a+b+c;其中I型為高增殖能力及低免疫細胞浸潤型,而III型為低增殖能力及高免疫細胞浸潤型,II型則介于兩者之間;分別檢測I型和II型,I型和III型以及II 型和III型的差異表達基因;
S3、將各分子分型的基因表達特征選取為構建分子分型預測模型的特征,其中I、II、III型基因表達特征數目分別為d、e、f個,且d+e+f=Y;
S4、 載入“mlbench”R 包,以患者編碼為唯一識別,隨機選取X*2/3例患者為訓練集,剩下的X*1/3例患者為驗證集;
S5、根據選取的患者編碼,使用“match”函數將轉錄組表達矩陣拆分為行名為患者編碼,列名為基因名的訓練矩陣及驗證矩陣,分別存入“train”及“validation”變量中;
S6、載入“caret”R包,使用訓練矩陣及對應的分子分型標簽,構建備選預測模型;
S7、使用least-group out 方法以75%樣本作為訓練集進行交叉驗證,以準確性作為標準自動挑選分子分型預測模型;
S8、使用構建的分子預測模型預測驗證集患者的分子分型,并與實際情況進行對比,繪制受試者工作特征曲線驗證其準確性,最終確定預測模型。
2.根據權利要求1所述的一種鼻咽癌分子分型的預測系統,其特征在于,步驟S2中,使用秩和檢驗分別檢測I型和II型,I型和III型以及II 型和III型不同亞型的差異表達基因。
3.根據權利要求1所述的一種鼻咽癌分子分型的預測系統,其特征在于,步驟S3中選取構建子分型預測模型特征時,在有標簽的訓練集中使用隨機森林算法構建分子分型預測模型。
4.根據權利要求1所述的一種鼻咽癌分子分型的預測系統,其特征在于,步驟S6中,構建備選預測模型時,利用train函數,設定算法為隨機森林,迭代100次。
5.根據權利要求1所述的一種鼻咽癌分子分型的預測系統,其特征在于,步驟S8中,利用predict函數使用構建的分子預測模型。
6.根據權利要求1所述的一種鼻咽癌分子分型的預測系統,其特征在于,步驟S8中,確定預測模型時,將預測模型保存為“Rdata”形式。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中山大學,未經中山大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110362236.X/1.html,轉載請聲明來源鉆瓜專利網。