[發明專利]基于片段化模式預測腫瘤風險值的方法有效
| 申請號: | 202011193149.8 | 申請日: | 2020-10-30 |
| 公開(公告)號: | CN112410422B | 公開(公告)日: | 2022-06-03 |
| 發明(設計)人: | 李世勇;吳巍;茅矛;陳彥 | 申請(專利權)人: | 深圳思勤醫療科技有限公司 |
| 主分類號: | C12Q1/6886 | 分類號: | C12Q1/6886;G16B20/20;G16B30/00;G16B40/00 |
| 代理公司: | 北京清亦華知識產權代理事務所(普通合伙) 11201 | 代理人: | 孫璐璐 |
| 地址: | 518000 廣東省深圳市鹽田區海山街*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 片段 模式 預測 腫瘤 風險 方法 | ||
本發明涉及生物信息領域,具體地,本發明涉及基于片段化模式的預測腫瘤風險值的方法、系統和計算機可讀介質。本發明提供基于片段化模式的預測腫瘤風險值的方法,同時比較總體不同片段的比例,也觀察不同染色體區域上的差異。發明人還發現使用P100的效果最好,能更好的區分癌癥和正常。針對不同染色體區域上短的插入片段與長的插入片段間的變化,最根本的原因是這個比值的偏離程度。因此,創新的通過計算差異總和來預測癌癥和正常人,相比于發表的方法,算法更加簡單,計算資源少,特征少,穩定性和普適性強,減少過擬合的可能。而且,還更加簡單直觀,便于理解。
技術領域
本發明涉及生物信息領域,具體地,本發明涉及基于片段化模式的預測腫瘤風險值的方法、系統和計算機可讀介質。
背景技術
ctDNA(Circulating tumor DNA)測序數據的插入片段長度分布在腫瘤和正常人之間存在明顯差異,有人使用插入片段來預測樣本來源,比如Mouliere,F.,et al.,Enhanced detection of circulating tumor DNA by fragment size analysis.SciTransl Med,2018.10(466),選取10-bp峰谷間距、P(160到180)、P(180到220)和P(250到320),有的文章采用P[150bp]來預測樣本來源。還有文章報道將人的基因組分成不同區域,在計算人染色體上不同區域的短的插入片段與長的插入片段的比例,最后通過PCA降維度,來預測樣本來源。但現有方法獲得的是多個值,特征多,建模容易過擬合,導致結果不準確。
因此,亟需開發一種計算資源少,特征少,穩定性和普適性強,減少過擬合的可能的新的預測待測樣本來源的方法。
發明內容
本發明旨在至少在一定程度上解決相關技術中的技術問題之一。為此,本發明提供基于片段化模式的預測待測樣本來源的方法,同時比較總體不同片段的比例,也觀察不同染色體區域上的差異。發明人還發現使用P100[30~100bp]的效果最好,因為P150下normal的比例分布的范圍大,而P100集中,這樣就更好的區分癌癥和正常。針對不同染色體區域上短的插入片段(100~150bp)與長的插入片段(151~220bp)間的變化,最根本的原因是這個比值的偏離程度。因此,創新的通過計算差異總和來預測癌癥和正常人,相比于發表的方法,算法更加簡單,計算資源少,特征少,穩定性和普適性強,減少過擬合的可能。而且,還更加簡單直觀,便于理解。
為此,本發明第一方面提供一種預測待測樣本來源的方法。根據本發明的實施例,所述方法包括:
(1)從待測樣本中獲取cfDNA樣本;
(2)基于所述cfDNA樣本,構建測序文庫;
(3)對所述測序文庫進行測序,以便獲得測序結果,所述測序結果由多個測序讀段構成;
(4)基于所述測序讀段,統計P100、P180、P250、峰谷間距和插入片段長度分布中峰值對應的片段長度;
(5)獲取待測樣本基因組,構建測序文庫并進行測序,基于測序結果中的測序讀段,以便獲得不同染色體區域中不同預定長度插入片段的測序讀段數目的比值,計算差異總和;
(6)對(4)和(5)獲得的結果使用機器學習的方法進行建模,基于建模結果預測待測樣本來源的分值,
其中,P100是指待測樣本的插入片段30~100bp的數量除以總的插入片段總數的數量的比值;
P180是指待測樣本的插入片段180~220bp的數量除以總的插入片段總數的數量的比值;
P250是指待測樣本的插入片段250~300bp的數量除以總的插入片段總數的數量的比值;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳思勤醫療科技有限公司,未經深圳思勤醫療科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011193149.8/2.html,轉載請聲明來源鉆瓜專利網。





