[發明專利]一種基于lincRNA表達譜組合特征的腎乳頭狀細胞癌早期預測方法在審
| 申請號: | 202010775535.1 | 申請日: | 2020-08-04 |
| 公開(公告)號: | CN111944902A | 公開(公告)日: | 2020-11-17 |
| 發明(設計)人: | 李文興;劉大海;劉蕾娜;焦文喬 | 申請(專利權)人: | 佛山科學技術學院 |
| 主分類號: | C12Q1/6886 | 分類號: | C12Q1/6886;G16B30/00;G16B25/10;G16B20/00;G16B40/20;G16H50/30 |
| 代理公司: | 北京權智天下知識產權代理事務所(普通合伙) 11638 | 代理人: | 王新愛 |
| 地址: | 528000 *** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 lincrna 表達 組合 特征 乳頭狀 細胞 早期 預測 方法 | ||
1.一種特征lincRNA表達譜組合,其特征在于,包括AC026401.3、AC040977.1、AC091563.1、AC104825.1、AF127577.4、ATP2B1-AS1、CRNDE、DNAJC3-DT、LINC00476、LINC01503、LINC02381、LINC02604、LINC02615、MIR210HG、MIR22HG、MIR4435-2HG、SEPT7-AS1和U91328.1,其核苷酸序列如SEQ ID NO.1-SEQ ID NO.18所示。
2.一種基于lincRNA表達譜組合特征的腎乳頭狀細胞癌早期預測方法,其特征在于,包括以下步驟:
步驟1、獲取腎乳頭狀細胞癌早期患者穩定差異表達的特征lincRNA;
步驟2、選取特征lincRNA表達數據,對每個樣本進行數據標準化;
步驟3、使用支持向量機對標準化后的數據構建早期預測模型;
步驟4、根據患者特征lincRNA的表達水平進行早期預測;
該方法用于非疾病的診斷和治療目的。
3.根據權利要求2所述的預測方法,其特征在于,所述的步驟1中的獲取腎乳頭狀細胞癌早期患者穩定差異表達的特征lincRNA具體為:
步驟1.1、從Genomic Data Commons Data Portal數據庫中下載腎乳頭狀細胞癌患者腫瘤組織和癌旁組織轉錄組數據以及臨床數據,獲得腎乳頭狀細胞癌患者腫瘤組織基因表達譜read counts數值,即為測序讀段數值,進行對數轉換;
步驟1.2、選取在所有樣本中lincRNA的read counts大于等于10的lincRNA,再對所有lincRNA的read counts取對數,設樣本總數為n,篩選后lincRNA總數為m,v為lincRNA的read counts,u為取對數之后的表達值,則有;
uij=log2vij,i∈(1,n),j∈(1,m) (1)
其中,i為樣本編號,j為lincRNA編號,uij為第i個樣本、第j個lincRNA編號取對數之后的表達值,vij為第i個樣本、第j個lincRNA編號的read counts數值;
步驟1.3、選取疾病分期為I期和II期的腎乳頭狀細胞癌患者,將這些患者記為腎乳頭狀細胞癌早期患者,腎乳頭狀細胞癌早期患者總數記為n′;
步驟1.4、選取在腫瘤和正常樣本中變異系數均小于0.2的lincRNA,即設μ為所有樣本中lincRNA的表達均值,σ為標準差,變異系數的計算公式為:
其中,j為lincRNA編號,cv為變異系數,cvj為第j個樣本的變異系數,σj為第j個lincRNA編號的標準差,μj為第j個lincRNA編號的lincRNA的表達均值,設m1為穩定表達的lincRNA總數,則有:
步驟1.5、選取腫瘤和正常樣本中差異表達的lincRNA;使用取對數后的表達值計算腫瘤和正常樣本lincRNA取對數后的倍數變化f,公式為:
其中,j為lincRNA編號,fj為第j個lincRNA編號的倍數變化,μ1j為第j個lincRNA編號的腫瘤樣本的表達均值,μ2j為第j個lincRNA編號的正常樣本的表達均值;
然后使用獨立樣本t檢驗比較腫瘤和正常樣本中lincRNA的表達差異,獨立樣本t檢驗公式為:
其中n1為腫瘤樣本數,n2為正常樣本數,μ1為腫瘤樣本lincRNA表達均值,μ2為正常樣本lincRNA表達均值,為腫瘤樣本lincRNA方差,為正常樣本lincRNA方差;
對所有t檢驗得出的p值進行錯誤發現率(false discovery rate,FDR)校正,定義q為FDR校正后的數值,r為p值在m1個lincRNA中排序后的位置,則有:
其中,j為lincRNA編號,qj代表第j個lincRNA編號的FDR校正后的數值,pj代表第j個lincRNA編號的t檢驗得出的p值,rj代表第j個lincRNA編號的p值在m1個lincRNA中排序后的位置;
最后選取倍數變化f的絕對值大于1且FDR校正后q值小于等于0.05的lincRNA,記為特征lincRNA,設特征lincRNA總數為m2,則有:
m2=m1{|fj|≥1,ηj<0.05},j∈(1,m1) (7)。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于佛山科學技術學院,未經佛山科學技術學院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010775535.1/1.html,轉載請聲明來源鉆瓜專利網。





