[發(fā)明專利]基于RNA靶向測序和機(jī)器學(xué)習(xí)的癌癥組織溯源方法在審
| 申請?zhí)枺?/td> | 201910654039.8 | 申請日: | 2019-07-19 |
| 公開(公告)號(hào): | CN110379465A | 公開(公告)日: | 2019-10-25 |
| 發(fā)明(設(shè)計(jì))人: | 楊家亮;王博;郎繼東;梁樂彬;張燕香;孫雪;張海鵬;王偉偉;田埂 | 申請(專利權(quán))人: | 元碼基因科技(北京)股份有限公司 |
| 主分類號(hào): | G16B50/30 | 分類號(hào): | G16B50/30;G16B40/20;C12Q1/6874 |
| 代理公司: | 北京北匯律師事務(wù)所 11711 | 代理人: | 高元吉 |
| 地址: | 100102 北京市朝陽區(qū)廣*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 測序 溯源 癌癥組織 機(jī)器學(xué)習(xí) 算法 腫瘤 目標(biāo)基因區(qū)域 測序技術(shù) 測序數(shù)據(jù) 高效富集 目標(biāo)區(qū)域 隨機(jī)森林 相關(guān)基因 預(yù)測模型 癌組織 反轉(zhuǎn)錄 靈敏度 數(shù)據(jù)集 準(zhǔn)確率 建庫 探針 通量 合成 檢測 預(yù)測 | ||
1.一種基于RNA靶向測序和機(jī)器學(xué)習(xí)的癌癥組織溯源方法,其特征在于,包括以下步驟:
(1)建立癌癥溯源數(shù)據(jù)庫,在多個(gè)癌種的基因表達(dá)數(shù)據(jù)中,以多個(gè)基因的表達(dá)數(shù)據(jù)作為特征,以癌種分類作為標(biāo)簽,建立所述癌癥溯源數(shù)據(jù)庫;
(2)確定溯源預(yù)測模型,使用隨機(jī)森林算法,設(shè)置每棵決策樹樁的最大特征數(shù)為取整,其中N為該森林所有特征數(shù),使用多棵決策樹樁對所述癌癥溯源數(shù)據(jù)庫進(jìn)行分類訓(xùn)練,根據(jù)占比權(quán)重挑選出包含目標(biāo)區(qū)域的多個(gè)模型基因,并保存為溯源預(yù)測模型;
(3)將從受試者的生物樣本獲取的RNA靶向測序數(shù)據(jù)輸入所述溯源預(yù)測模型,由此得到癌癥的組織溯源。
2.根據(jù)權(quán)利要求1所述的基于RNA靶向測序和機(jī)器學(xué)習(xí)的癌癥組織溯源方法,其特征在于,在步驟(2)的確定溯源預(yù)測模型中包括對所述溯源預(yù)測模型進(jìn)行交叉驗(yàn)證的步驟,其中所述交叉驗(yàn)證包括:
a.將所述癌癥溯源數(shù)據(jù)庫中的樣本數(shù)據(jù)隨機(jī)地分成n份,選擇其中的1份作為測試集,其余的n-1份作為訓(xùn)練集;以所述n-1份訓(xùn)練集訓(xùn)練模型,并對所述測試集進(jìn)行測試,由此完成一次驗(yàn)證;
b.重復(fù)步驟a進(jìn)行n次,從而完成所述交叉驗(yàn)證。
3.根據(jù)權(quán)利要求2所述的基于RNA靶向測序和機(jī)器學(xué)習(xí)的癌癥組織溯源方法,其特征在于,在步驟(2)的確定溯源預(yù)測模型中進(jìn)一步包括利用臨床樣本數(shù)據(jù)進(jìn)行再次驗(yàn)證,從而計(jì)算評(píng)價(jià)指數(shù)的步驟。
4.根據(jù)權(quán)利要求3所述的基于RNA靶向測序和機(jī)器學(xué)習(xí)的癌癥組織溯源方法,其特征在于,所述評(píng)價(jià)指數(shù)包括精確度、召回率和F1分?jǐn)?shù)。
5.根據(jù)權(quán)利要求1所述的基于RNA靶向測序和機(jī)器學(xué)習(xí)的癌癥組織溯源方法,其特征在于,所述RNA靶向測序數(shù)據(jù)包括通過探針雜交和/或多重PCR獲得的數(shù)據(jù)。
6.根據(jù)權(quán)利要求1所述的基于RNA靶向測序和機(jī)器學(xué)習(xí)的癌癥組織溯源方法,其特征在于,所述RNA靶向測序數(shù)據(jù)包括液相雜交捕獲和擴(kuò)增子測序獲得的數(shù)據(jù)。
7.根據(jù)權(quán)利要求1所述的基于RNA靶向測序和機(jī)器學(xué)習(xí)的癌癥組織溯源方法,其特征在于,所述癌種包括膀胱癌、乳腺癌、宮頸癌、結(jié)腸癌、多形成性膠質(zhì)細(xì)胞瘤、頭頸鱗狀細(xì)胞癌、腎透明細(xì)胞癌、腎乳頭狀細(xì)胞癌、急性髓細(xì)胞樣白血病、腦低級(jí)別膠質(zhì)瘤、肝細(xì)胞肝癌、肺腺癌、肺鱗癌、卵巢漿液性囊腺癌、胰腺癌、前列腺癌、直腸腺癌、胃癌、甲狀腺癌和子宮內(nèi)膜癌。
8.根據(jù)權(quán)利要求7所述的基于RNA靶向測序和機(jī)器學(xué)習(xí)的癌癥組織溯源方法,其特征在于,所述包含目標(biāo)區(qū)域的多個(gè)模型基因選自由下述基因組成的組:AARD、ACPP、ACSM2A、ACSM2B、ANGPTL4、ANKRD30A、ANXA2P3、ATP5EP2、AZGP1、C6orf222、CDHR5、CDX1、CDX2、CHRNA2、CILP、CREB3L4、CRYGN、DAPK2、EEF1A1P9、EFHD1、EMX2、EMX2OS、ENPP3、ESM1、ESR1、FOXA1、FOXE1、FSIP1、FTH1P3、GALNT14、GATA3、GATA3-AS1、H3F3C、HNF1B、HNF4A、HOXB13、IRX5、KCNJ16、KLHL14、KLK2、KLK3、KLK4、KRT5、KRT6C、LCN12、LMX1B、LOC407835、LOC643387、MAGED2、MGAT4C、MGP、MSX1、MYB、NACA2、NACAP1、NAPSA、NAT1、NDUFA4L2、NKX2-1、NKX3-1、NME2P1、NOX1、OR51E2、PA2G4P4、PAX8、PKP1、PPIAL4C、PRLR、RDH11、RERG、RMST、RPL17、RPL19P12、RPL23P8、SALL1、SCGB2A2、SCGB3A2、SFTA3、SFTPA1、SFTPA2、SFTPB、SFTPC、SFTPD、SLC39A6、SLC45A3、SOX17、SPDEF、TBC1D9、TG、TM4SF5、TMEM241、TP63、TPO、TRPS1、TSHR、UBE2MP1、UQCRBP1、XBP1、YBX3P1和ZNF552。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于元碼基因科技(北京)股份有限公司,未經(jīng)元碼基因科技(北京)股份有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910654039.8/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 溯源交互系統(tǒng)及溯源系統(tǒng)交互方法
- 單溯源碼農(nóng)產(chǎn)品分級(jí)溯源管理系統(tǒng)及方法
- 多溯源碼農(nóng)產(chǎn)品分級(jí)溯源管理系統(tǒng)及方法
- 食品安全溯源系統(tǒng)及方法
- 一種基于區(qū)塊鏈的溯源數(shù)據(jù)的獲取方法及相關(guān)設(shè)備
- 溯源方法、溯源裝置、溯源系統(tǒng)和存儲(chǔ)介質(zhì)
- 一種基于區(qū)塊鏈技術(shù)的溯源應(yīng)用系統(tǒng)
- 一種基于區(qū)塊鏈技術(shù)的溯源管理系統(tǒng)
- 一種聚合溯源的方法和相關(guān)裝置
- 一種醫(yī)學(xué)實(shí)驗(yàn)室監(jiān)管溯源系統(tǒng)及方法
- 診斷癌癥的試劑及試劑盒
- 來自腫瘤組織的納米囊泡及使用該納米囊泡的癌癥疫苗
- 新型癌癥病變標(biāo)記用組合物
- 一種對癌癥患者進(jìn)行術(shù)后監(jiān)控的微創(chuàng)方法
- 塞尼卡谷病毒(SVV)細(xì)胞受體靶向的腫瘤治療
- 一種基于新鮮癌組織貼片法制備檢測標(biāo)本的方法
- 一種基于組織器官分化層次關(guān)系的癌癥類型預(yù)測系統(tǒng)和方法
- 一種用于人體腫瘤分子分型的基因組合及其應(yīng)用
- 基于營養(yǎng)表觀基因組學(xué)的癌癥風(fēng)險(xiǎn)檢測方法及防癌配方
- 一種基于卷積神經(jīng)網(wǎng)絡(luò)的癌癥邊界智能識(shí)別方法
- 在多個(gè)機(jī)器學(xué)習(xí)任務(wù)上訓(xùn)練機(jī)器學(xué)習(xí)模型
- 用于機(jī)器學(xué)習(xí)系統(tǒng)的學(xué)習(xí)教練
- 用于訓(xùn)練機(jī)器學(xué)習(xí)模型的方法及系統(tǒng)
- 用于機(jī)器學(xué)習(xí)模型的并行化坐標(biāo)下降法
- 機(jī)器學(xué)習(xí)裝置和機(jī)器學(xué)習(xí)裝置的機(jī)器學(xué)習(xí)方法
- 一種機(jī)器學(xué)習(xí)程序更新方法、裝置及設(shè)備
- 模型優(yōu)化方法、裝置、存儲(chǔ)介質(zhì)及服務(wù)器
- 修改機(jī)器學(xué)習(xí)模型以改善局部性
- 管理機(jī)器學(xué)習(xí)特征
- 一種基于強(qiáng)化學(xué)習(xí)的自動(dòng)化機(jī)器學(xué)習(xí)系統(tǒng)





