[發(fā)明專利]一種計算染色體結構變異及單親二倍體信息的方法在審
| 申請?zhí)枺?/td> | 202210250688.3 | 申請日: | 2022-03-15 |
| 公開(公告)號: | CN114566217A | 公開(公告)日: | 2022-05-31 |
| 發(fā)明(設計)人: | 喻長順;李冬梅;劉洪洲;孫思哲;李恪;陳建春;賈曉冬;李行;汲珊珊 | 申請(專利權)人: | 天津金域醫(yī)學檢驗實驗室有限公司 |
| 主分類號: | G16B20/30 | 分類號: | G16B20/30;G16B20/20 |
| 代理公司: | 北京沁優(yōu)知識產權代理有限公司 11684 | 代理人: | 周慶路 |
| 地址: | 300457 天津市濱海新區(qū)天津濱海*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 計算 染色體 結構 變異 單親 二倍體 信息 方法 | ||
本發(fā)明公開了一種計算染色體結構變異及單親二倍體信息的方法,包括如下步驟:S1、隨機選取一萬例全外單樣本的原始測序文件,并采用illumina測序配套的bed文件;S2、基于選取的一萬例全外單樣本篩選出具有代表性的雜合bed,根據每個雜合bed的純合度計算UPD基線;S3、將測試樣本與步驟S2計算得到的UPD基線進行對比計算生成相應的UPD結果;S4、UPD計算結果可視化。本發(fā)明能實現了快速、全面地鎖定可能具有染色體缺失、重復、單親二倍體的變異,并且通過隱馬爾可夫模型預測以及數據可視化的方式全方位的展現每條染色體的變異形式,從而實現了目前最大限度的高效分析。
技術領域
本發(fā)明涉及染色體結構分析技術領域,更具體的說是涉及一種計算染色體結構變異及單親二倍體信息的方法。
背景技術
全外顯子組測序已經成為檢測人類遺傳病的常用手段,可覆蓋近6000種遺傳病。但是,檢測結果的分析尚存在巨大的挑戰(zhàn)。其中拷貝數變異是基因結構變異的重要組成部分,由基因組發(fā)生重排而導致, 一般指長度為1 kb以上的基因組大片段的拷貝數增加或者減少, 主要表現為亞顯微水平的缺失(deletion)和重復(duplication)。染色體單親二倍體異常常與家族遺傳病相關,每個臨床樣本分析需要從不同的角度分析這三種變異,面對大量的臨床樣本人工分析需要耗費大量的時間和精力。
目前市面上已有的全外、CNVseq報告中,尚沒有醫(yī)生想要看到的,醫(yī)生能秒懂的附圖,實際工作中,偶爾會遇到非親生父親參與檢查,從而有可能會出現誤認為是“自發(fā)突變”的變異位點,然后其致病性的分類可能被不恰當地高估。
發(fā)明內容
本發(fā)明的目的在于提供了一種計算染色體結構變異及單親二倍體信息的方法,通過選取具有代表性的雜合bed建立UPD基線,實現了準確的鎖定可能具有染色體缺失、重復、單親二倍體的變異。
為實現上述目的,本發(fā)明提供了如下技術方案:一種計算染色體結構變異及單親二倍體信息的方法,包括如下步驟:
S1、隨機選取一萬例全外單樣本的原始測序文件,并采用illumina測序配套的bed文件;
S2、基于選取的一萬例全外單樣本篩選出具有代表性的雜合bed,根據每個雜合bed的純合度計算UPD基線;
S3、將測試樣本與步驟S2計算得到的UPD基線進行對比計算生成相應的UPD結果。
作為本發(fā)明的進一步改進,所述步驟S2包括:
S201、對原始測序文件中每一例樣本的雜合位點進行篩選,篩選條件類型包括SNP位點、Freq、Filter和SegDup;
S202、將篩選后的所有樣本的結果與illumina測序配套的bed文件進行區(qū)間比對,選取具有代表性的雜合bed。
作為本發(fā)明的進一步改進,所述步驟S201中的篩選條件包括篩選SNP位點發(fā)生單堿基置換的,Freq大于等于20X且小于等于80X的,Filter質控通過的,SegDup不等于空值的雜合位點。
作為本發(fā)明的進一步改進,所述S201中采用染色體長臂和短臂分開計算的方法,通過多重比對分析選取具有代表性的雜合bed。
作為本發(fā)明的進一步改進,所述步驟S2還包括:
S203、將步驟S202中選取的具有代表性的雜合bed中連續(xù)的雜合bed區(qū)域進行合并。
作為本發(fā)明的進一步改進,所述步驟S2還包括:
S204、統(tǒng)計步驟S203中合并后的雜合bed區(qū)域中每個bed區(qū)域內的雜合位點數,并基于雜合位點數計算出每個bed區(qū)域的純合度,根據每個bed區(qū)域的純合度計算UPD基線。
作為本發(fā)明的進一步改進,所述步驟S3包括:
S301、將測試樣本的雜合位點與UPD基線通過annovar軟件進行比對,篩選出雜合度高的雜合位點;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津金域醫(yī)學檢驗實驗室有限公司,未經天津金域醫(yī)學檢驗實驗室有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210250688.3/2.html,轉載請聲明來源鉆瓜專利網。





