[發(fā)明專利]基于共表達相似性搭建肺腺癌早期診斷模型有效
| 申請?zhí)枺?/td> | 201711223597.6 | 申請日: | 2017-11-29 |
| 公開(公告)號: | CN109841281B | 公開(公告)日: | 2023-09-29 |
| 發(fā)明(設(shè)計)人: | 趙杰;李礪鋒;張超奇;薛文華;翟運開;范智蕊;張騰飛;丁顯飛;宋曉琴;沈志博;馬丙鈞;朱子家;梁淑紅 | 申請(專利權(quán))人: | 鄭州大學(xué)第一附屬醫(yī)院 |
| 主分類號: | G16H50/20 | 分類號: | G16H50/20;G16H50/30 |
| 代理公司: | 常州佰業(yè)騰飛專利代理事務(wù)所(普通合伙) 32231 | 代理人: | 高姍 |
| 地址: | 450001 河*** | 國省代碼: | 河南;41 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 表達 相似性 搭建 腺癌 早期 診斷 模型 | ||
本發(fā)明屬于肺腺癌預(yù)測技術(shù)領(lǐng)域,具體涉及一種基于共表達相似性識別肺腺癌早期診斷標(biāo)識及風(fēng)險預(yù)測模型的構(gòu)建方法,其包括數(shù)據(jù)重塑及分組、數(shù)據(jù)標(biāo)準(zhǔn)化、phase特異性基因提取、基因共表達相關(guān)性分析、無監(jiān)督聚類分析、特異性和非特異性共表達網(wǎng)絡(luò)分析、功能通路富集、顯著變異通路識別、REE算法篩選早篩標(biāo)識基因、基于早篩風(fēng)險基因建立分類模型和生存分析驗證等步驟。本發(fā)明方法可以實現(xiàn)對肺癌的早期診斷,同時識別出伴隨肺癌進展而顯著發(fā)生動態(tài)變化的基因標(biāo)識。
技術(shù)領(lǐng)域
本發(fā)明屬于肺腺癌預(yù)測技術(shù)領(lǐng)域,具體涉及基于共表達相似性搭建肺腺癌早期診斷模型。
背景技術(shù)
肺腺癌(lung?adenocarcinoma)是肺癌的一種,屬于非小細(xì)胞癌。不同于鱗狀細(xì)胞肺癌,肺腺癌較容易發(fā)生于女性及不抽煙者。起源于支氣管粘膜上皮,少數(shù)起源于大支氣管的粘液腺。發(fā)病率比鱗癌和未分化癌低,發(fā)病年齡較小,女性相對多見。多數(shù)腺癌起源于較小的支氣管,為周圍型肺癌。早期一般沒有明顯的臨床癥狀,往往在胸部X線檢查時被發(fā)現(xiàn)。表現(xiàn)為圓形或橢圓形腫塊,一般生長較慢,但有時早期即發(fā)生血行轉(zhuǎn)移,淋巴轉(zhuǎn)移則發(fā)生較晚。
對于肺腺癌的診斷檢查,臨床上常用的方法有以下幾種:X線檢查、支氣管鏡檢查、放射性核素檢查、細(xì)胞學(xué)檢查、剖胸探查術(shù)、ECT檢查、縱隔鏡檢查。但是上述診斷方法均不能滿足對肺腺癌早期診斷的這種要求。
發(fā)明內(nèi)容
本發(fā)明主要提供了基于共表達相似性搭建肺腺癌早期診斷模型,可以實現(xiàn)對肺癌的早期診斷,同時識別出伴隨肺癌進展而顯著發(fā)生動態(tài)變化的基因標(biāo)識。其技術(shù)方案如下:
基于共表達相似性搭建肺腺癌早期診斷模型,包括以下步驟:
(1)數(shù)據(jù)重塑及分組:首先對肺癌數(shù)據(jù)根據(jù)樣本臨床信息進行分組,每個樣本臨床分級信息分為phaseI、phaseII、phaseIII、phaseIV四組;
(2)數(shù)據(jù)標(biāo)準(zhǔn)化:對數(shù)據(jù)進行標(biāo)準(zhǔn)化預(yù)處理,對于缺失值大于10%的基因和樣本進行剔除,其余存在缺失值的樣本用對應(yīng)基因在其他樣本中的均值進行替換,以正常對照control組作為對照組,計算每個基因在對照組中的均值和標(biāo)準(zhǔn)差,然后對所有樣本實現(xiàn)Z-score標(biāo)準(zhǔn)化,基因在對照組中的表達服從均值為0,方差為1的標(biāo)準(zhǔn)正態(tài)分布,因此若基因i在正常健康樣本以及早期或中晚期的肺腺癌樣本中不存在差異,則基因i的表達值應(yīng)服從正態(tài)分布,否則認(rèn)為基因i在早期或中晚期肺癌樣本中相對于健康人群存在明顯差異,這種差異表達基因可能成為肺腺癌早期診斷的標(biāo)志物;
(3)phase特異性基因提取:利用變異系數(shù)來評估基因在肺腺癌樣本中的波動情況,變異系數(shù)通過公式1計算,
其中,mean為基因在所有肺腺癌樣本中的表達均值,sd為對應(yīng)的標(biāo)準(zhǔn)差,CV越大說明基因正向波動越顯著,CV越小說明基因負(fù)向波動越顯著,根據(jù)變異系數(shù)在所有基因中的分布,只篩選出變異系數(shù)在雙尾25%的基因作為可能和肺腺癌相關(guān)的基因,剩下的50%基因則由于在0附近存在較小的波動,因此可以認(rèn)為和肺腺癌不相關(guān),為了識別在肺腺癌早期即發(fā)生差異表達的基因,利用limma算法對于基因在control組和early?phase患者中的表達情況進行顯著性評估,顯著性閾值為0.05且|logfc|1,識別出的早期肺腺癌相關(guān)基因標(biāo)記為Δ0,同樣的,為了識別出在中晚期發(fā)生差異表達的基因,對control組和late?phase的肺腺癌樣本進行比較分析,識別出中晚期肺腺癌相關(guān)基因標(biāo)記為Δ1,而早期風(fēng)險基因與中晚期風(fēng)險基因的交集,則稱為既能實現(xiàn)早期診斷肺腺癌的特征,又是伴隨肺腺癌進展的重要臨床指標(biāo),標(biāo)記為Δ2;
(4)基因共表達相關(guān)性分析:考察了在control,early?phase,late?phase三個狀態(tài)下,早期風(fēng)險基因Δ0和中晚期風(fēng)險基因Δ1,以及交集基因Δ2的表達相關(guān)性,采用pearson相關(guān)系數(shù),大于0.5的認(rèn)為是正相關(guān),低于-0.5的認(rèn)為是負(fù)相關(guān);
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于鄭州大學(xué)第一附屬醫(yī)院,未經(jīng)鄭州大學(xué)第一附屬醫(yī)院許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711223597.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 基于異類關(guān)系確定目標(biāo)相似性的方法和系統(tǒng)
- 相似性匹配系統(tǒng)和方法
- 相似性匹配系統(tǒng)和方法
- 興趣點預(yù)測和推薦中的用戶時空相似性度量方法
- 一種基于相似性和邏輯矩陣分解的miRNA?疾病關(guān)聯(lián)關(guān)系預(yù)測方法
- 一種結(jié)合二分網(wǎng)絡(luò)和文本的醫(yī)院科室相似性分析方法
- 一種基于相似性學(xué)習(xí)及其增強的細(xì)胞類型鑒定方法
- 確定企業(yè)屬性相似性、重名對象判定
- 獲取機構(gòu)技術(shù)相似性的方法及裝置
- 一種基于圖卷積神經(jīng)網(wǎng)絡(luò)的lncRNA-蛋白質(zhì)相互作用預(yù)測方法





