[發(fā)明專利]一種特征mRNA表達(dá)譜組合及肺鱗癌早期預(yù)測方法在審
| 申請(qǐng)?zhí)枺?/td> | 202010769767.6 | 申請(qǐng)日: | 2020-08-04 |
| 公開(公告)號(hào): | CN111793691A | 公開(公告)日: | 2020-10-20 |
| 發(fā)明(設(shè)計(jì))人: | 高躍東;李文興 | 申請(qǐng)(專利權(quán))人: | 中國科學(xué)院昆明動(dòng)物研究所 |
| 主分類號(hào): | C12Q1/6886 | 分類號(hào): | C12Q1/6886;G16B25/10;G16B35/00;G16B5/00;G16B40/00;G16H50/20 |
| 代理公司: | 北京權(quán)智天下知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11638 | 代理人: | 王新愛 |
| 地址: | 650000 云*** | 國省代碼: | 云南;53 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 特征 mrna 表達(dá) 組合 肺鱗癌 早期 預(yù)測 方法 | ||
1.一種特征mRNA表達(dá)譜組合,其特征在于,包括A2M、ALDH2、ASAH1、CAT、CD55、CD74、CENPH、CTSH、CTSO、ECT2、HSD17B11、KANK2、MYL9、PECAM1、PERP、RFC4、SERPING1、SLC2A1、TGFBR2和VIM,其核苷酸探針序列如SEQ ID NO.1-20所示。
2.一種基于權(quán)利要求1所述的特征mRNA表達(dá)譜組合的肺鱗癌早期預(yù)測方法,其特征在于,包括以下步驟:
步驟1、獲取肺鱗癌早期患者穩(wěn)定差異表達(dá)的特征mRNA;
步驟2、選取特征mRNA表達(dá)數(shù)據(jù),對(duì)每個(gè)樣本進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化;
步驟3、使用支持向量機(jī)對(duì)標(biāo)準(zhǔn)化后的數(shù)據(jù)構(gòu)建早期預(yù)測模型;
步驟4、根據(jù)患者特征mRNA的表達(dá)水平進(jìn)行早期預(yù)測;
該方法為非疾病的診斷和治療目的。
3.根據(jù)權(quán)利要求2所述的肺鱗癌早期預(yù)測方法,其特征在于,所述步驟1中的獲取肺鱗癌早期患者穩(wěn)定差異表達(dá)的特征mRNA,具體為:
步驟1.1、從Genomic Data Commons Data Portal數(shù)據(jù)庫中下載肺鱗癌患者腫瘤組織和癌旁組織轉(zhuǎn)錄組數(shù)據(jù)以及臨床數(shù)據(jù),獲得肺鱗癌患者腫瘤組織基因表達(dá)譜read counts數(shù)值,即為測序讀段數(shù)值,進(jìn)行對(duì)數(shù)轉(zhuǎn)換;
步驟1.2、選取具有一定表達(dá)豐度的mRNA,即在所有樣本中mRNA的read counts大于等于10;再對(duì)所有mRNA的read counts取對(duì)數(shù),設(shè)樣本總數(shù)為n,篩選后mRNA總數(shù)為m,v為mRNA的read counts,u為取對(duì)數(shù)之后的表達(dá)值,則有:
uij=log2vij,i∈(1,n),j∈(1,m) (1)
其中,i為樣本編號(hào),j為mRNA編號(hào),uij為第i個(gè)樣本、第j個(gè)mRNA編號(hào)取對(duì)數(shù)之后的表達(dá)值,vij為第i個(gè)樣本、第j個(gè)mRNA編號(hào)的read counts數(shù)值;
步驟1.3、選取疾病分期為I期和II期的肺鱗癌患者,將這些患者記為肺鱗癌早期患者,肺鱗癌早期患者總數(shù)記為n′;
步驟1.4、選取腫瘤和正常樣本中穩(wěn)定表達(dá)的mRNA,即在腫瘤和正常樣本中變異系數(shù)均小于0.1的mRNA,設(shè)μ為所有樣本中mRNA的表達(dá)均值,σ為標(biāo)準(zhǔn)差,變異系數(shù)的計(jì)算公式為:
其中,j為mRNA編號(hào),cv為變異系數(shù),cvj為第j個(gè)樣本的變異系數(shù),σj為第j個(gè)mRNA編號(hào)的標(biāo)準(zhǔn)差,μj為第j個(gè)mRNA編號(hào)的mRNA的表達(dá)均值,設(shè)m1為穩(wěn)定表達(dá)的mRNA總數(shù),則有:
步驟1.5、選取腫瘤和正常樣本中差異表達(dá)的mRNA;使用取對(duì)數(shù)后的表達(dá)值計(jì)算腫瘤和正常樣本mRNA取對(duì)數(shù)后的倍數(shù)變化f,公式為:
其中,j為mRNA編號(hào),fj為第j個(gè)mRNA編號(hào)的倍數(shù)變化,μ1j為第j個(gè)mRNA編號(hào)的腫瘤樣本的表達(dá)均值,μ2j為第j個(gè)mRNA編號(hào)的正常樣本的表達(dá)均值;
然后使用獨(dú)立樣本t檢驗(yàn)比較腫瘤和正常樣本中mRNA的表達(dá)差異,獨(dú)立樣本t檢驗(yàn)公式為:
其中n1為腫瘤樣本數(shù),n2為正常樣本數(shù),μ1為腫瘤樣本mRNA表達(dá)均值,μ2為正常樣本mRNA表達(dá)均值,為腫瘤樣本mRNA方差,為正常樣本mRNA方差;
對(duì)所有t檢驗(yàn)得出的p值進(jìn)行錯(cuò)誤發(fā)現(xiàn)率(false discovery rate,F(xiàn)DR)校正,定義q為FDR校正后的數(shù)值,r為p值在m1個(gè)mRNA中排序后的位置,則有:
其中,j為mRNA編號(hào),qj代表第j個(gè)mRNA編號(hào)的FDR校正后的數(shù)值,pj代表第j個(gè)mRNA編號(hào)的t檢驗(yàn)得出的p值,rj代表第j個(gè)mRNA編號(hào)的p值在m1個(gè)mRNA中排序后的位置;
最后選取倍數(shù)變化丁的絕對(duì)值大于1且FDR校正后q值小于等于0.05的mRNA,記為特征mRNA,設(shè)特征mRNA總數(shù)為m2,則有:
m2=m1{|fj|≥1,qj≤0.05},j∈(1,m1) (7)。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國科學(xué)院昆明動(dòng)物研究所,未經(jīng)中國科學(xué)院昆明動(dòng)物研究所許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010769767.6/1.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- RNAi轉(zhuǎn)染子的改良選擇方法
- 雙控雙調(diào)節(jié)原核表達(dá)載體系統(tǒng)及其構(gòu)建方法和用途
- 表達(dá)載體組織、新的生產(chǎn)用細(xì)胞產(chǎn)生方法及其在重組產(chǎn)生多肽中的用途
- 大腸桿菌表達(dá)系統(tǒng)表達(dá)人淀粉樣Aeta蛋白及純化的方法
- 一種智能表達(dá)式解析平臺(tái)及方法
- 一種復(fù)合表達(dá)式解析方法及系統(tǒng)
- 一種制備N-乙酰氨基半乳糖轉(zhuǎn)移酶的方法
- 定制生成表達(dá)式方法及裝置
- 文本的表達(dá)方法、裝置、電子設(shè)備及可讀存儲(chǔ)介質(zhì)
- 基因表達(dá)調(diào)節(jié)DNA,表達(dá)盒,表達(dá)載體





