[發明專利]檢測體細胞單核苷酸突變的方法和裝置有效
| 申請號: | 201410708748.7 | 申請日: | 2014-11-28 |
| 公開(公告)號: | CN104462869B | 公開(公告)日: | 2017-12-26 |
| 發明(設計)人: | 張蘭英;于海燕;張廣鑫;龐行云;孟雪紅;曹銀川;吳曉朦;李林;宋欠欠;張燕艷 | 申請(專利權)人: | 天津諾禾致源生物信息科技有限公司 |
| 主分類號: | G06F19/22 | 分類號: | G06F19/22;C12Q1/68;C12M1/34 |
| 代理公司: | 北京康信知識產權代理有限責任公司11240 | 代理人: | 吳貴明,張永明 |
| 地址: | 301700 天津市*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 檢測 體細胞 核苷酸 突變 方法 裝置 | ||
1.一種檢測體細胞單核苷酸突變的方法,其特征在于,所述方法包括以下步驟:
S1,對來源于體細胞的DNA測序數據與參考基因組數據進行比對,得到所有SNP位點的數據;其中,所述SNP位點的數據包括所述SNP位點位于基因上的位置信息和所述SNP位點導致氨基酸發生同義突變或非同義突變的變異類型信息;
S2,從所有SNP位點的數據中篩選出發生在剪接位點上的SNP位點和發生在外顯子上且導致氨基酸發生非同義突變的SNP位點,得到第一SNP位點集;
S3,去除所述第一SNP位點集中千人突變頻率高于5%的SNP位點,得到第二SNP位點集;
S4,從所述第二SNP位點集中篩選出體細胞突變來源的SNP位點,得到第三SNP位點集;以及
S5,從所述第三SNP位點集中篩選出所述測序數據中頻率低于75%的SNP位點,得到包含所述體細胞單核苷酸突變的SNP位點;
其中,頻率低于75%的SNP位點是指支持匹配突變基因型的序列數目占比對到同一位置上的總比對序列數目的比值低于75%。
2.根據權利要求1所述的方法,其特征在于,在所述步驟S1中,所述來源于體細胞的DNA測序數據包括全基因組DNA測序數據或目標區域的DNA測序數據。
3.根據權利要求2所述的方法,其特征在于,當所述來源于體細胞的DNA測序數據為目標區域的DNA測序數據時,所述來源于體細胞的DNA測序數據的制備步驟包括:
對來源于體細胞的DNA通過液相雜交捕獲的方法制備成目標區域的DNA測序文庫;
對所述目標區域的DNA測序文庫進行測序,得到所述來源于體細胞的DNA測序數據。
4.根據權利要求1所述的方法,其特征在于,所述步驟S3包括:
將所述第一SNP位點集與千人基因組數據庫進行比對,得到比對數據;
從所述比對數據中去除千人突變頻率高于5%的SNP位點,得到所述第二SNP位點集。
5.根據權利要求1所述的方法,其特征在于,所述步驟S4包括:
將所述第二SNP位點集與單核苷酸多態性數據庫進行比對,篩選出所述第二SNP位點集中來源于體細胞突變的SNP位點,得到過濾SNP位點;
對所述過濾SNP位點與Clinvar數據庫進行比對,篩選出所述過濾SNP位點中來源于體細胞突變的SNP位點,得到所述第三SNP位點集。
6.根據權利要求5所述的方法,其特征在于,所述步驟S4中:所述單核苷酸多態性數據庫和所述Clinvar數據庫中來源于體細胞突變的SNP位點的SAO值為2或3。
7.根據權利要求1所述的方法,其特征在于,所述步驟S5包括:
對所述測序數據中比對到基因組同一位置上的測序序列數進行統計,得到同一位置上匹配參考基因組序列的第一總序列數和匹配含有SNP位點的序列的第二總序列數;
計算所述第二總序列數占所述第一總序列數和所述第二總序列數之和的比值,得到所述同一位置的測序序列的突變頻率;
從所述第三SNP位點集中篩選出所述突變頻率低于75%的SNP位點,得到包含所述體細胞單核苷酸突變的SNP位點。
8.一種檢測體細胞單核苷酸突變的裝置,其特征在于,所述裝置包括以下模塊:
序列比對模塊,用于對來源于體細胞的DNA測序數據與參考基因組數據進行比對,得到所有SNP位點的數據;其中,所述SNP位點的數據包括所述SNP位點位于基因上的位置信息和所述SNP位點導致氨基酸發生同義突變或非同義突變的變異類型信息;
第一篩選模塊,用于從所有SNP位點的數據中篩選出發生在剪接位點上的SNP位點或/和發生在外顯子上且導致氨基酸發生非同義突變的SNP位點,得到第一SNP位點集;
第二篩選模塊,用于從所述第一SNP位點集中去除千人突變頻率高于5%的SNP位點,得到第二SNP位點集;
第三篩選模塊,用于從所述第二SNP位點集中篩選出體細胞突變來源的SNP位點,得到第三SNP位點集;以及
第四篩選模塊,用于從所述第三SNP位點集中篩選出所述測序數據中頻率低于75%的SNP位點,得到包含所述體細胞單核苷酸突變的SNP位點;
其中,頻率低于75%的SNP位點是指支持匹配突變基因型的序列數目占比對到同一位置上的總比對序列數目的比值低于75%。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津諾禾致源生物信息科技有限公司,未經天津諾禾致源生物信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410708748.7/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種信息處理方法及電子設備
- 下一篇:氣道侵襲性曲霉病評分模型及其建立方法
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建?;蚍抡妫纾焊怕誓P突騽討B模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





