[發明專利]疾病篩查模型的構建方法、疾病篩查模型及篩查裝置有效
| 申請號: | 202110228795.1 | 申請日: | 2021-03-01 |
| 公開(公告)號: | CN112599251B | 公開(公告)日: | 2022-02-18 |
| 發明(設計)人: | 曹善柏;周濤;張萌萌;郭璟;樓峰 | 申請(專利權)人: | 北京橡鑫生物科技有限公司;天津橡鑫生物科技有限公司;北京橡鑫醫學科技有限公司 |
| 主分類號: | G16H50/70 | 分類號: | G16H50/70;G06N20/00;G16B20/10;G16B50/30;G06F16/2455 |
| 代理公司: | 北京康信知識產權代理有限責任公司 11240 | 代理人: | 路秀麗 |
| 地址: | 100080 北京市通州區經*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 疾病 模型 構建 方法 裝置 | ||
本發明提供了一種疾病篩查模型的構建方法、疾病篩查模型及篩查裝置。該模型的構建方法包括:從兩組測序數據中篩選出滿足預測條件的多個待檢特征,兩組測序數據包括陽性樣本組中各陽性樣本的測序數據和陰性樣本組中各陰性樣本的測序數據;利用多個待檢特征進行機器學習,從而構建得到疾病篩查模型。通過獲取多個陽性樣本和多個陰性樣本的測序數據,并根據兩組測序數據的特征差異,從中選擇出與疾病關聯性較強的多個特征作為表征兩組不同疾病狀態的待檢特征進行機器學習建模,從而獲得不同疾病的篩查模型,該模型提高了篩查的準確性。
技術領域
本發明涉及基于測序數據的篩查模型構建領域,具體而言,涉及一種疾病篩查模型的構建方法、疾病篩查模型及篩查裝置。
背景技術
目前關于很多疾病(包括癌癥等)的高通量測序數據的處理方法,主要集中在常見熱點基因突變情況的檢測、通過增加檢測基因數量及檢測深度等方法來提高檢測的準確性。這些方法是從增加處理數據的基因數量或深度的角度來提高數據處理結果的準確性的。
目前,對于在無法增加或不增加基因數量或測序深度的情況下,如何使處理結果準確性提高,目前尚無有效的解決方案。
發明內容
本發明的主要目的在于提供一種疾病篩查模型的構建方法、疾病篩查模型及篩查裝置,以解決現有技術中難以在不增加基因數量或測序深度的情況下難以提高處理結果準確性的問題。
為實現上述目標,根據本申請的一個方面,提供了一種疾病篩查模型的構建方法,該構建方法包括:從兩組測序數據中篩選出滿足預測條件的多個待檢特征,兩組測序數據包括陽性樣本組中各陽性樣本的測序數據和陰性樣本組中各陰性樣本的測序數據;利用多個待檢特征進行機器學習,從而構建得到疾病篩查模型。
進一步地,從兩組測序數據中篩選出滿足預測條件的多個待檢特征包括:統計兩組測序數據中各樣本的候選特征;對各候選特征分別繪制ROC曲線;篩選出AUC≥預設值的候選特征,作為待檢特征;其中,各樣本的候選特征選自如下特征中的多個:1)文庫濃度;2)CNV;3)異常比對reads;4)插入片段大小;5)末端堿基;優選地,預設值≥0.7;優選地,測序數據的測序深度為0.1×~1×。
進一步地,2)CNV包括CNV個數及CNV總長度;優選地,3)異常比對reads包括:soft-clip reads占總reads數的比例,記為第一比例;插入片段大于100000bp的reads占總reads數的比例,記為第二比例;以及第一比例與第二比例之和;優選地,4)插入片段大小包括:不同插入片段長度范圍的reads數占總reads的比例;以及不同插入片段長度范圍的reads數占總reads數的比例的熵;優選地,5)末端堿基包括:支持reads末端1-5個bp長度的各堿基組合類型reads數占總reads數的比例;以及reads末端1-5個bp長度的各堿基組合類型reads數占總reads數的比例的熵。
進一步地,待檢特征選自如下多種:a.文庫濃度;b. 插入片段大于100000bp的reads占總reads數的比例;c. CNV個數;d. CNV總長度;e. 不同插入片段長度范圍的reads數占總reads數的比例的熵;f.支持reads末端1bp的reads數各占總reads數的比例;g. 支持reads末端1bp的reads數各占總reads數的比例的熵;h.支持reads末端2bp的reads數各占總reads數的比例;i. 支持reads末端2bp的reads數各占總reads數的比例的熵;優選地,不同插入片段長度范圍包括90-100 bp、100-110 bp、110-120 bp、120-130 bp、130-140bp、140-150 bp、150-160 bp、160-170 bp、170-180bp及330-390bp。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京橡鑫生物科技有限公司;天津橡鑫生物科技有限公司;北京橡鑫醫學科技有限公司,未經北京橡鑫生物科技有限公司;天津橡鑫生物科技有限公司;北京橡鑫醫學科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110228795.1/2.html,轉載請聲明來源鉆瓜專利網。





