[發(fā)明專利]拷貝數變異預測方法、裝置、計算機設備和存儲介質有效
| 申請?zhí)枺?/td> | 202010185580.1 | 申請日: | 2020-03-17 |
| 公開(公告)號: | CN111402951B | 公開(公告)日: | 2022-07-12 |
| 發(fā)明(設計)人: | 姚鳴;張鵬;王凱 | 申請(專利權)人: | 至本醫(yī)療科技(上海)有限公司 |
| 主分類號: | G16B20/10 | 分類號: | G16B20/10;G16B20/20 |
| 代理公司: | 華進聯(lián)合專利商標代理有限公司 44224 | 代理人: | 姜曉云 |
| 地址: | 200135 上海市浦東新區(qū)(*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 拷貝 變異 預測 方法 裝置 計算機 設備 存儲 介質 | ||
本申請涉及一種拷貝數變異預測方法、裝置、計算機設備和存儲介質。所述方法包括:接收輸入的待測樣本及對照樣本對應的基因序列文件;對基因序列文件進行分析得到單核苷酸多態(tài)性位點;根據預設輸入參數計算邏輯,計算所得到的單核苷酸多態(tài)性位點對應的模型輸入參數;將模型輸入參數輸入至位點拷貝數變異識別模型中,得到每個單核苷酸多態(tài)性位點對應的拷貝數狀態(tài)及分割點位置;將每個單核苷酸多態(tài)性位點對應的拷貝數狀態(tài)及分割點位置輸入至染色體拷貝數變異識別模型中,得到待測樣本對應的拷貝數變異狀態(tài)及對應每一拷貝數變異狀態(tài)的百分比,染色體拷貝數變異識別模型是根據長短期記憶網絡訓練模型得到的。采用本方法能夠提高預測準確性。
技術領域
本申請涉及生物技術領域,特別是涉及一種拷貝數變異預測方法、裝置、計算機設備和存儲介質。
背景技術
隨著生物技術的發(fā)展,出現(xiàn)了檢測一個樣本中是否存在染色體拷貝數異常的技術,拷貝數變異(Copy Number Variation,CNV)是由基因組發(fā)生重排而導致的,一般指長度為1kb以上的基因組大片段的拷貝數增加或者減少,主要表現(xiàn)為亞顯微水平的缺失和重復。CNV是基因組結構變異(Structural Variation,SV)的重要組成部分。CNV位點的突變率遠高于SNP(Single Nucleotide Polymorphism),是腫瘤類疾病的重要致病因素之一。
然而,傳統(tǒng)的技術方案是利用一個待檢測的樣本的基因組測序數據,通過數據分析的方法,判斷樣本中是否存在染色體拷貝數異常的問題,例如通過馬爾代夫序列進行預測,但是馬爾代夫序列因為是連續(xù)性有限、模式單一,這樣就會造成檢測不準確。
發(fā)明內容
基于此,有必要針對上述技術問題,提供一種能夠提高預測準確性的拷貝數變異預測方法、裝置、計算機設備和存儲介質。
一種拷貝數變異預測方法,所述方法包括:
接收輸入的待測樣本以及對照樣本對應的基因序列文件;
對所述基因序列文件進行分析得到單核苷酸多態(tài)性位點;
根據預設輸入參數計算邏輯,計算所得到的單核苷酸多態(tài)性位點對應的模型輸入參數;
將所述模型輸入參數輸入至預先訓練完成的位點拷貝數變異識別模型中,得到每個所述單核苷酸多態(tài)性位點對應的拷貝數狀態(tài)以及分割點位置;
將每個所述單核苷酸多態(tài)性位點對應的拷貝數狀態(tài)以及分割點位置輸入至預先訓練完成的染色體拷貝數變異識別模型中,得到所述待測樣本對應的拷貝數變異狀態(tài)以及對應每一所述拷貝數變異狀態(tài)的百分比,所述染色體拷貝數變異識別模型是根據長短期記憶網絡訓練模型得到的。
在其中一個實施例中,所述將每個所述單核苷酸多態(tài)性位點對應的拷貝數狀態(tài)以及分割點位置輸入至預先訓練完成的染色體拷貝數變異識別模型中,得到所述待測樣本對應的拷貝數變異狀態(tài)以及對應每一所述拷貝數變異狀態(tài)的百分比之后,還包括:
將所述待測樣本對應的拷貝數變異狀態(tài)以及對應每一所述拷貝數變異狀態(tài)的百分比輸入至腫瘤預測模型中,得到所述待測樣本對應的腫瘤含量以及倍型,所述腫瘤預測模型是根據長短期記憶網絡訓練模型得到的。
在其中一個實施例中,所述對所述基因序列文件進行分析得到單核苷酸多態(tài)性位點,包括:
從所述待測樣本和對照樣本對應的基因序列文件中的提取基因序列,并將所提取的基因序列分別與標準基因組進行比對,得到單核苷酸多態(tài)性位點。
在其中一個實施例中,所述根據預設輸入參數計算邏輯,計算所得到的單核苷酸多態(tài)性位點對應的模型輸入參數,包括:
統(tǒng)計所述待測樣本的基因序列與所述標準基因組相同的第一序列以及不同的第二序列;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于至本醫(yī)療科技(上海)有限公司,未經至本醫(yī)療科技(上海)有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010185580.1/2.html,轉載請聲明來源鉆瓜專利網。





