[發(fā)明專利]利用血漿游離核酸檢測癌癥的深度學(xué)習(xí)方法和系統(tǒng)有效
| 申請?zhí)枺?/td> | 202110021990.7 | 申請日: | 2021-01-08 |
| 公開(公告)號: | CN112820407B | 公開(公告)日: | 2022-06-17 |
| 發(fā)明(設(shè)計)人: | 汪小我;李嘉琦;魏磊 | 申請(專利權(quán))人: | 清華大學(xué) |
| 主分類號: | G16H50/30 | 分類號: | G16H50/30;G16H50/20;G16B20/20;G16B20/50;G16B20/30;G16B30/00;G16B40/00 |
| 代理公司: | 北京清亦華知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 11201 | 代理人: | 李巖 |
| 地址: | 10008*** | 國省代碼: | 北京;11 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 利用 血漿 游離 核酸 檢測 癌癥 深度 學(xué)習(xí)方法 系統(tǒng) | ||
本發(fā)明公開了一種利用血漿游離核酸檢測癌癥的深度學(xué)習(xí)方法和系統(tǒng),其中,方法包括以下步驟:通過使用核酸分子級別分辨率的甲基化狀態(tài)數(shù)據(jù)定義癌癥特異的差異甲基化區(qū)間,從而達到富集分子分辨率級別的信息的效果;使用深度學(xué)習(xí)模型整合核酸分子的序列信息以及甲基化信息從而達成精確的核酸分子來源預(yù)測;通過計算最大后驗概率的方式估計血漿中來自癌癥的核酸序列片段占比,從而起到癌癥的非侵入式輔助診斷的效果。將本發(fā)明的方法應(yīng)用于癌癥檢測中,能夠在非常低深度的測序數(shù)據(jù)上達到穩(wěn)定的預(yù)測效果,從而在降低檢測成本的同時保證足夠的靈敏性與準(zhǔn)確性。
技術(shù)領(lǐng)域
本發(fā)明涉及生物信息與醫(yī)療技術(shù)領(lǐng)域,特別涉及一種利用血漿游離核酸檢測癌癥的深度學(xué)習(xí)方法和系統(tǒng)。
背景技術(shù)
在生物體內(nèi),伴隨著細胞凋亡等過程,細胞內(nèi)的DNA片段會被釋放到血漿中成為游離DNA(cell-free DNA,簡稱cfDNA)。在癌癥發(fā)生早期,當(dāng)患者還未表現(xiàn)出明顯的臨床癥狀時,細胞內(nèi)DNA的狀態(tài)就已經(jīng)發(fā)生了變化,這些DNA被釋放到血漿中,使得血漿cfDNA蘊含了與癌癥相關(guān)的信息。通過對這些信息進行提取和處理,即可對癌癥進行非侵入式診斷,實現(xiàn)癌癥的早診早治。
目前癌癥cfDNA相關(guān)研究的主流思路是利用cfDNA上與癌癥相關(guān)的單基因或少數(shù)基因的突變推斷癌癥的發(fā)生。然而,cfDNA本質(zhì)上是一個信噪比較低的混合信號,在癌癥發(fā)生早期癌cfDNA比例極低,影響基因突變的檢出率;此外,由于癌癥突變的異質(zhì)性很強,不同的個體發(fā)生突變的位點很可能不同,限制了該技術(shù)的進一步應(yīng)用。此外,對cfDNA片段的整體性質(zhì)進行統(tǒng)計和分析,例如拷貝數(shù)變異,片段化模式等也可以反映出癌癥發(fā)生的相關(guān)信息,但是由于這些信號噪聲較大,在癌癥發(fā)生早期的診斷準(zhǔn)確率較為有限。對比而言,DNA甲基化由于在癌癥發(fā)生早期即會在全基因組水平上發(fā)生較為顯著的變化,被認為是一種具有癌癥早篩應(yīng)用潛力的基因組特征。
通過使用全基因組甲基化測序(WGBS)技術(shù),可以同時獲得血漿中cfDNA的序列信息以及甲基化狀態(tài)信息,使用深度學(xué)習(xí)模型,能夠?qū)⑦@樣高精度的信息進行整合,從而實現(xiàn)高精度的序列來源預(yù)測,并根據(jù)預(yù)測結(jié)果進行癌癥信號的檢測以及癌癥的非侵入式篩查。
然而,現(xiàn)有的基于單條讀段(read)的癌癥檢測方式并沒有充分利用序列信息,這使得序列的來源預(yù)測準(zhǔn)確程度不足,尤其在低測序深度下表現(xiàn)不夠穩(wěn)定,亟待解決。
發(fā)明內(nèi)容
本發(fā)明旨在至少在一定程度上解決相關(guān)技術(shù)中的技術(shù)問題之一。
為此,本發(fā)明的一個目的在于提出一種利用血漿游離核酸檢測癌癥的深度學(xué)習(xí)方法,通過使用深度學(xué)習(xí)對數(shù)據(jù)的整合能力與對大量數(shù)據(jù)的分析能力,實現(xiàn)對血漿中cfDNA序列來源的預(yù)測,實現(xiàn)高精度的非侵入式癌癥早期檢測。
本發(fā)明的另一個目的在于提出一種利用血漿游離核酸檢測癌癥的深度學(xué)習(xí)系統(tǒng)。
為達到上述目的,本發(fā)明一方面實施例提出了一種利用血漿游離核酸檢測癌癥的深度學(xué)習(xí)方法,包括以下步驟:使用核酸分子級別分辨率的甲基化狀態(tài)數(shù)據(jù)定義癌癥特異的差異甲基化區(qū)間,并從所述差異甲基化區(qū)間篩選得到富集分子分辨率級別的信息;使用深度學(xué)習(xí)模型整合所述信息中核酸分子的序列信息和甲基化信息,并根據(jù)整合后的信息預(yù)測核酸分子來源;計算所述核酸分子來源的最大后驗概率,根據(jù)所述最大后驗概率估計血漿中來自癌癥的核酸序列片段占比,以根據(jù)所述占比確定癌癥的風(fēng)險結(jié)果。
本發(fā)明實施例的利用血漿游離核酸檢測癌癥的深度學(xué)習(xí)方法,使用深度學(xué)習(xí)模型判斷血漿中游離核酸分子組織來源以及根據(jù)預(yù)測結(jié)果進行癌癥檢測,從而能夠在非常低深度的測序數(shù)據(jù)上達到穩(wěn)定的預(yù)測效果,在降低檢測成本的同時保證足夠的靈敏性與準(zhǔn)確性。
另外,根據(jù)本發(fā)明上述實施例的利用血漿游離核酸檢測癌癥的深度學(xué)習(xí)方法還可以具有以下附加的技術(shù)特征:
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于清華大學(xué),未經(jīng)清華大學(xué)許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110021990.7/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 上一篇:天線組件及電子設(shè)備
- 下一篇:一種天然人造混合草皮及其制備方法





