[發明專利]一種基于lincRNA表達譜組合特征的腎乳頭狀細胞癌早期預測方法在審
| 申請號: | 202010775535.1 | 申請日: | 2020-08-04 |
| 公開(公告)號: | CN111944902A | 公開(公告)日: | 2020-11-17 |
| 發明(設計)人: | 李文興;劉大海;劉蕾娜;焦文喬 | 申請(專利權)人: | 佛山科學技術學院 |
| 主分類號: | C12Q1/6886 | 分類號: | C12Q1/6886;G16B30/00;G16B25/10;G16B20/00;G16B40/20;G16H50/30 |
| 代理公司: | 北京權智天下知識產權代理事務所(普通合伙) 11638 | 代理人: | 王新愛 |
| 地址: | 528000 *** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 lincrna 表達 組合 特征 乳頭狀 細胞 早期 預測 方法 | ||
本發明公開了一種特征lincRNA表達譜組合及腎乳頭狀細胞癌早期預測方法,lincRNA的核苷酸序列如SEQ ID NO.1?SEQ ID NO.18所示。該方法包括以下步驟:獲取腎乳頭狀細胞癌早期患者穩定差異表達的特征lincRNA;選取特征lincRNA表達數據,對每個樣本進行數據標準化;使用支持向量機對標準化后的數據構建早期預測模型;根據患者特征lincRNA的表達水平進行早期預測。本發明具有很高的精確度和準確率(ROC曲線下面積AUC=0.988)。只需要獲取上述18種lincRNA的相對表達量,就能計算出腎乳頭狀細胞癌早期患病概率,可作為腎乳頭狀細胞癌早期預測和治療的參考依據。
技術領域
本發明屬于生物技術和醫學技術領域,具體地說,涉及一種基于lincRNA表達譜組合特征的腎乳頭狀細胞癌早期預測方法。
背景技術
腎乳頭狀細胞癌(kidney renal papillary cell carcinoma)約占腎細胞癌的15%。其發病年齡一般為50-70歲,男女患病比率為2-3.9:1。腎乳頭狀細胞癌預后較好,5年生存率能達到80%以上。全球疾病負擔(Global Burden of Disease,GBD)數據顯示,2017年全球患有腎癌的人數超過210萬,其中中國患病人數約為27萬。2017年全球患有腎癌的死亡人數約為14萬,占總死亡人數的0.25%。中國2017年死亡患者數約為1.7萬,占總死亡人數的0.16%。統計結果顯示,從1990年到2017年全球腎癌患病率和死亡率持續增長。近十年來中國腎癌患病人數,患病率和死亡率相對穩定。
支持向量機(Support Vector Machine,SVM)是一類按監督學習方式對數據進行二元分類的廣義線性分類器,其決策邊界是對學習樣本求解的最大邊距超平面。SVM模型是將實例表示為空間中的點,這樣映射就使得單獨類別的實例被盡可能寬的明顯的間隔分開。然后,將新的實例映射到同一空間,并基于它們落在間隔的哪一側來預測所屬類別。當訓練數據是線性可分時,SVM通過硬間隔最大化學習進行分類。當訓練數據線性不可分時,SVM通過使用核技巧以及軟間隔最大化學習進行分類。SVM對于特征含義相似的中等大小的數據集很強大,也適用于小型數據集。通常情況下,對樣本量小于1萬的數據集SVM都有很好的預測效果。SVM在疾病診斷、腫瘤分類、腫瘤基因識別等有著廣泛的應用。
腫瘤早期診斷一直是醫學界的難題。現有的早期診斷方法多是觀測某一個或一類標志物的表達水平,難以達到理想的診斷效果。由于這些標志物在腫瘤患者和正常人群中的表達分布有部分重疊,難以界定標志物的臨界值將腫瘤患者和正常人群較好地分開。因此,利用多個標志物表達特征組合可能是腫瘤早期診斷的一種有效方法。長鏈基因間非編碼RNA(long intergenic non-coding RNA,lincRNA)是一類位于基因間非編碼序列的長度大于200個核苷酸的非編碼單鏈RNA分子。lincRNA不具有編碼潛力并且在不同物種之間不保守。研究表明lincRNA參與多個基因的表達調控,在人體內表達相對穩定且容易檢測。由于單個lincRNA分子在腫瘤和正常人群中表達分布有重疊,難以界定早期診斷的臨界值。
因此,有必要建立一種更穩定的多個差異lincRNA表達特征組合的預測模型將有助于腎乳頭狀細胞癌的早期預測。
發明內容
有鑒于此,本發明提供了一種基于lincRNA表達譜組合特征的腎乳頭狀細胞癌早期預測方法,能夠準確地進行腎乳頭狀細胞癌I/II期預測。
為了解決上述技術問題,本發明公開了一種特征lincRNA表達譜組合,包括AC026401.3、AC040977.1、AC091563.1、AC104825.1、AF127577.4、ATP2B1-AS1、CRNDE、DNAJC3-DT、LINC00476、LINC01503、LINC02381、LINC02604、LINC02615、MIR210HG、MIR22HG、MIR4435-2HG、SEPT7-AS1和U91328.1,其核苷酸序列如SEQ ID NO.1-SEQ ID NO.18所示。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于佛山科學技術學院,未經佛山科學技術學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010775535.1/2.html,轉載請聲明來源鉆瓜專利網。





