[發明專利]檢測基因組區域中的結構變異的方法在審
| 申請號: | 202011162206.6 | 申請日: | 2020-10-27 |
| 公開(公告)號: | CN112349346A | 公開(公告)日: | 2021-02-09 |
| 發明(設計)人: | 魏從翀;劉成林;張周;畢騰騰;王洪明;張之宏;揣少坤;漢雨生 | 申請(專利權)人: | 廣州燃石醫學檢驗所有限公司 |
| 主分類號: | G16B20/20 | 分類號: | G16B20/20;G16B20/30;G06K9/62 |
| 代理公司: | 北京市柳沈律師事務所 11105 | 代理人: | 凃滔 |
| 地址: | 510320 廣東省廣州市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 檢測 基因組 區域 中的 結構 變異 方法 | ||
1.檢測基因組區域中的結構變異(SV)的方法,所述方法包括:
a.讀取高通量測序數據的序列比對文件,
i)將含有soft-clipping的讀長作為SR(Split-read)信號進入SR信號分析流程;和/或
ii)將在參考基因組中的回貼方向不是正向-反向的讀長對,以及在參考基因組中回貼方向是正向-反向但具有異常插入片段長度(insert size)的讀長對作為PE(Paired-end)信號進入PE信號分析流程;
b.進行SR信號分析流程以標記SV類型,并將標記為同一SV事件的SR信號進行聚類后形成SR信號聚類;和/或進行PE信號分析流程以標記SV類型,并將標記為同一SV事件的PE信號進行聚類后形成PE信號聚類;
c.對所述SR信號聚類和/或所述PE信號聚類進行過濾,從而獲得過濾后的信號聚類,其指示基因組區域中的SV;和任選地
d.輸出結果報告。
2.檢測基因組區域中的結構變異(SV)的方法,所述方法包括:
a.讀取高通量測序數據的序列比對文件,將含有soft-clipping的讀長作為SR信號進入SR信號分析流程;將在參考基因組中的回貼方向不正向-反向的讀長對,以及在參考基因組中回貼方向是正向-反向但具有異常插入片段長度的讀長對作為PE信號進入PE信號分析流程;
b.分別進行SR信號分析流程和PE信號分析流程以標記SV類型,并將標記為同一SV事件的SR信號進行聚類后形成SR信號聚類,將標記為同一SV事件的PE信號進行聚類后形成PE信號聚類;
c.根據斷點坐標信息和讀長的QNAME合并標記為同一SV事件的SR信號聚類和PE信號聚類,以形成綜合信號聚類,所述綜合信號聚類包括合并的SR信號聚類和PE信號聚類,或未能合并的單獨SR信號聚類或PE信號聚類;
d.對所述綜合信號聚類進行過濾,從而獲得過濾后的綜合信號聚類,其指示基因組區域中的SV;和任選地
e.輸出結果報告。
3.如權利要求1或2所述的方法,其中所述序列比對文件選自SAM文件和BAM文件。
4.如權利要求1-3中任一項所述的方法,其中通過以下步驟確定所述具有異常插入片段長度的讀長:
讀取所述序列比對文件中的所有讀長的插入片段長度值,或隨機讀取一定數量的讀長的插入片段長度值;
使用所述插入片段長度值構建插入片段長度分布,并確定顯著高于所述插入片段長度分布的異常閾值;和
確定具有超過所述異常閾值的插入片段長度的讀長。
5.權利要求4所述的方法,其中通過以下步驟確定所述具有異常插入片段長度的讀長:
讀取所述序列比對文件中的所有讀長的插入片段長度值,或隨機讀取一定數量的讀長的插入片段長度值;
使用所述插入片段長度值構建normal或log-normal分布,并計算所述normal或log-normal分布的參數μ和σ;和
將具有超過μ+Nσ的插入片段長度值確定為具有異常插入片段長度值,
其中N為3-10之間的整數。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于廣州燃石醫學檢驗所有限公司,未經廣州燃石醫學檢驗所有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011162206.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種芯片可拆卸的智能卡
- 下一篇:一種電力變壓器安裝裝置





