[發明專利]新發突變的標簽標注方法、裝置、存儲介質及服務器在審
| 申請號: | 202211438913.2 | 申請日: | 2022-11-16 |
| 公開(公告)號: | CN115762637A | 公開(公告)日: | 2023-03-07 |
| 發明(設計)人: | 連驁杰 | 申請(專利權)人: | 湖南省婦幼保健院(湖南省生殖醫學研究院) |
| 主分類號: | G16B20/50 | 分類號: | G16B20/50;G16B30/00;G16B50/00;G16B40/20 |
| 代理公司: | 北京知果之信知識產權代理有限公司 11541 | 代理人: | 蘇利 |
| 地址: | 410028*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 突變 標簽 標注 方法 裝置 存儲 介質 服務器 | ||
本申請公開了一種新發突變的標簽標注方法、裝置、存儲介質及服務器。該標簽標注方法包括:接收來自第一數據庫的第一測序數據;根據所述第一測序數據確定每個個體對應的可疑新發突變;依據所述可疑新發突變確定假新發突變,并通過給所述假新發突變標注上第一標簽,形成陰性訓練樣本;參照預設模擬規則處理所述可遺傳且只在親代與子代間傳遞了一次的突變,然后通過不同家系親代間的兩兩替換得到模擬新發突變,并通過給所述模擬新發突變標注上第二標簽,形成陽性訓練樣本。本申請解決了市面上新發突變預測工具準確率較低、操作相對復雜以及現實中獲得的經Sanger測序驗證過的真新發突變的樣本量很小造成的不足以支撐訓練出一個高精度的分類器的技術問題。
技術領域
本申請涉及新發突變檢測領域,具體而言,涉及一種新發突變的標簽標注方法、裝置、存儲介質及服務器。
背景技術
在人類遺傳學領域,之前主要關注遺傳性疾病,這是因為傳統的疾病識別方法主要依賴于在具有多個受影響的家庭成員的家系中,定位相關的基因位置,然后再利用Sanger測序來識別候選基因中的致病突變。隨著測序技術的不斷進步,大量的研究都利用WES(Who l e Exome Sequenc i ng)或WGS(Who l e Genome Sequenc i ng)來鑒定相關疾病突變,因為此技術可以檢測絕大多數的遺傳變異。雖然Sanger測序仍然是鑒定新發突變的金標準,但是隨著測序數據的不斷增大,例如在一項涉及9000位人員的WGS研究中,想利用Sanger測序鑒定所有的新發突變并研究其功能顯然是不太現實的,這就要求研究人員開發出一款可以在高通量測序數據中相對準確地檢測新發突變的工具來進行下游的分析,如此一來,許多的新發突變檢測工具由此誕生。
Kobo l dt等開發了VarScan,用于在大規模并行測序中檢測SNP和I nde l,并且評估它們的突變頻率,同時VarScan還可以與多個比對器兼容(BLAT, Newb l er,cross_match,Bowt i e and Novoa l i gn)。對于單個樣品,它可以基于讀段的個數,堿基質量和等位基因頻率實現對種系突變的鑒定和過濾。還可以通過比較兩者的讀段個數,通過與正常和腫瘤測序數據比對確定每種突變的體細胞狀態。隨后更新的VarScan2完善了更多功能,能夠檢測腫瘤外顯子測序中的體細胞突變以及拷貝數變異。該軟件基于Java平臺編寫,適用于各種操作系統。Bi ngshan等使用基于似然的框架來調用單核苷酸變異并檢測單核苷酸突變,工具叫作Po l ymutt。該方式基于E l ston-Stewart剝離算法來評估特定的遺傳突變、個體基因型以及新發突變。隨后一種有著更好的算法,基于貝葉斯模型的升級版Tri odenovo問世。該方法通過將先驗突變率與數據分割開來,通過對仿真以及真實數據進行應用,證明了此方法比別的方法具有更高的靈敏度和特異性。forestDNM則是用R語言編寫的,利用隨機森林算法在全基因組測序數據中檢測單核苷酸突變工具。DenovoGear則是利用了基于似然錯誤的模型進行新發突變的檢測。novoCa l l er工具是在家系和人群的測序數據中,利用貝葉斯網絡來檢測位于編碼區的新發突變。人們通常也會直接利用GATK的各種參數來對原始的突變進行過濾,最終得到新發突變。
但是無論哪種工具,并不能有效過濾掉預測新發突變結果中所有的假陽性,并且工具所能適應的變異識別平臺有限,且準確率不高;而且現實中獲得的經 Sanger測序驗證過的真新發突變樣本量很小,并不足以支撐訓練出一個高精度的分類器。
針對相關技術中預測新發突變出錯率很高,且現實中獲得的經Sanger測序驗證過的真新發突變的樣本量很小造成的不足以支撐訓練出一個高精度的分類器的問題,目前尚未提出有效的解決方案。
發明內容
本申請的主要目的在于提供一種新發突變的標簽標注方法、裝置、存儲介質及服務器,以解決現在市面上預測新發突變軟件出錯率很高,且獲得的經 Sanger測序驗證過的真新發突變的樣本量很小造成的不足以支撐訓練出一個高精度的分類器的問題。
為了實現上述目的,根據本申請的一個方面,提供了一種新發突變的標簽標注方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于湖南省婦幼保健院(湖南省生殖醫學研究院),未經湖南省婦幼保健院(湖南省生殖醫學研究院)許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202211438913.2/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種無機防火地坪漆及其制備方法
- 下一篇:一種抗風浪海洋牧場養殖裝置





