[發明專利]一種基于單腫瘤樣本拷貝數變異及缺失類型檢測方法有效
| 申請號: | 201711219637.X | 申請日: | 2017-11-28 |
| 公開(公告)號: | CN108154007B | 公開(公告)日: | 2021-06-29 |
| 發明(設計)人: | 袁細國;白俊;李杰;楊利英;張軍英;高美虹 | 申請(專利權)人: | 西安電子科技大學 |
| 主分類號: | G16B20/10 | 分類號: | G16B20/10;G16B20/20 |
| 代理公司: | 西安長和專利代理有限公司 61227 | 代理人: | 黃偉洪;何畏 |
| 地址: | 710071 陜西省*** | 國省代碼: | 陜西;61 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 腫瘤 樣本 拷貝 變異 缺失 類型 檢測 方法 | ||
1.一種基于單腫瘤樣本拷貝數變異及缺失類型檢測方法,其特征在于,所述基于單腫瘤樣本拷貝數變異及缺失類型檢測方法包括以下步驟:
(1)數據輸入,SAM文件,Read.txt文件,以及參考序列;
(2)讀段數規整化處理,在輸入文件的基礎上,針對比對后的讀段數,設置bin的大小為1000,計算每個bin的read count(RC),設計以下公式進行規整化處理,即對GC含量進行更正并對RC進行平衡化處理:
其中,表示所觀察到的第i個bin的RC,和分別表示全基因RC平均值和與第i個bin具有相同GC含量bin的RC平均值,re表示錯誤比對的RC,L_read,N_read,和N_bin分別表示讀段的長度,SAM文件中讀段的個數,以及全基因組中bin的個數,Qj表示第j個讀段的比對質量;
公式(3)主要是用于對讀段數進行平衡化處理,其中rmax和rmin分別表示全基因中最大的RC和最小的RC,以構建合理的統計檢驗分布;
(3)建立統計檢驗模型
在進行GC含量更正及RC平衡化處理基礎之上,利用讀段數服從泊松分布的性質,計算每個bin的概率值,依據該概率值建立正態分布,進而計算每個bin的p值,設計顯著性水平閾值,低于該閾值的bin被認為發生了顯著的拷貝數變異;
設計迭代檢測過程,即將顯著的bin剔除掉,重復利用公式(3)對RC進行平衡,進而重新構建正態分布,以檢測弱顯著的拷貝數變異;
(4)基于貝葉斯理論的拷貝數變異狀態推導
針對顯著的bin,通過構建貝葉斯推理模型,公式(4)和(5),對拷貝數擴展與缺失,拷貝數雜合子缺失與同源缺失狀態進行推理:
針對公式(4)其貝葉斯概率計算方法公式(6)和(7),其中先驗概率通過顯著的bin概率進行估計,而條件概率p(bini∈CNV|gain)和p(bini∈CNV|loss)通過觀察到的RC值計算;針對公式(5),也可采用同樣的方法進行計算:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于西安電子科技大學,未經西安電子科技大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711219637.X/1.html,轉載請聲明來源鉆瓜專利網。





