[發明專利]檢測體細胞單核苷酸突變的方法和裝置有效
| 申請號: | 201410708748.7 | 申請日: | 2014-11-28 |
| 公開(公告)號: | CN104462869B | 公開(公告)日: | 2017-12-26 |
| 發明(設計)人: | 張蘭英;于海燕;張廣鑫;龐行云;孟雪紅;曹銀川;吳曉朦;李林;宋欠欠;張燕艷 | 申請(專利權)人: | 天津諾禾致源生物信息科技有限公司 |
| 主分類號: | G06F19/22 | 分類號: | G06F19/22;C12Q1/68;C12M1/34 |
| 代理公司: | 北京康信知識產權代理有限責任公司11240 | 代理人: | 吳貴明,張永明 |
| 地址: | 301700 天津市*** | 國省代碼: | 天津;12 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 檢測 體細胞 核苷酸 突變 方法 裝置 | ||
技術領域
本發明涉及高通量測序領域,具體而言,涉及一種檢測體細胞單核苷酸突變的方法和裝置。
背景技術
個體的每個細胞中都可能會攜帶有兩種類型的突變:種系突變和體細胞突變,種系突變是指在生殖細胞中發生的可遺傳突變,也稱為生殖細胞突變。假如種系突變發生,則個體中的所有細胞都會攜帶該種系突變。種系突變之外的突變為體細胞突變,這些突變并不是從親代遺傳得到,而是受環境和其他因素影響而發生了改變。
使用高通量測序的方式可以測到覆蓋樣本中所有基因的序列,結合相關變異檢測軟件可檢測到樣本中目標基因上存在的所有變異信息。目前能夠用來檢測體細胞突變的方法是使用mutect軟件,它在檢測體細胞突變時,需要一組成對的樣品,即可能帶有體細胞突變的待檢樣品和可以提供種系突變的對照樣品。將兩個樣品進行比對,當突變在待檢樣品中出現,而未在對照樣品中出現,則認為該突變為待檢樣品中的一個體細胞突變。使用該方法檢測體細胞突變時需要對兩個樣品分別進行兩次高通量測序,增加了成本。
目前使用單個樣本做變異檢測的軟件,對于檢測結果往往不區分種系突變和體細胞突變。而提供體細胞突變信息的軟件,如mutect又需要一組成對的樣品。因而,現有技術中還未開發出既能采用單個樣本進行檢測從而降低檢測成本又能檢測到體細胞突變的檢測方法,仍需要對現有技術進行改進,以滿足行業內對上述體細胞突變的檢測要求。
發明內容
本發明的主要目的在于提供一種檢測體細胞單核苷酸突變的方法和裝置,不僅能夠利用單個樣品實現體細胞突變的檢測,而且降低檢測成本。
為了實現上述目的,根據本發明的一個方面,提供了一種檢測體細胞單核苷酸突變的方法,該方法包括以下步驟:S1,對來源于體細胞的DNA測序數據與參考基因組數據進行比對,得到所有SNP位點的數據;其中,SNP位點的數據包括SNP位點位于基因上的位置信息和SNP位點導致氨基酸發生同義突變或非同義突變的變異類型信息;S2,從所有SNP位點的數據中篩選出發生在剪接位點上的SNP位點和發生在外顯子上且導致氨基酸發生非同義突變的SNP位點,得到第一SNP位點集;S3,去除第一SNP位點集中千人突變頻率高于5%的SNP位點,得到第二SNP位點集;S4,從第二SNP位點集中篩選出體細胞突變來源的SNP位點,得到第三SNP位點集;以及S5,從第三SNP位點集中篩選出測序數據中包含SNP位點的序列的頻率低于75%的SNP位點,得到包含體細胞單核苷酸突變的SNP位點。
進一步地,在步驟S1中,來源于體細胞的DNA測序數據包括全基因組DNA測序數據或目標區域的DNA測序數據。
進一步地,當來源于體細胞的DNA測序數據為目標區域的DNA測序數據時,來源于體細胞的DNA測序數據的制備步驟包括:對來源于體細胞的DNA通過液相雜交捕獲的方法制備成目標區域的DNA測序文庫;對目標區域的DNA測序文庫進行測序,得到來源于體細胞的DNA測序數據。
進一步地,步驟S3包括:將第一SNP位點集與千人基因組數據庫進行比對,得到比對數據;從比對數據中去除千人突變頻率高于5%的SNP位點,得到第二SNP位點集。
進一步地,步驟S4包括:將第二SNP位點集與單核苷酸多態性數據庫進行比對,篩選出第二SNP位點集中來源于體細胞突變的SNP位點,得到過濾SNP位點;對過濾SNP位點與Clinvar數據庫進行比對,篩選出過濾SNP位點中來源于體細胞突變的SNP位點,得到第三SNP位點集。
進一步地,步驟S4中:單核苷酸多態性數據庫和Clinvar數據庫中來源于體細胞突變的SNP位點的SAO值為2或3。
進一步地,步驟S5包括:對測序數據中比對到基因組同一位置上的測序序列數進行統計,得到同一位置上匹配參考基因組序列的第一總序列數和匹配含有SNP位點的序列的第二總序列數;計算第二總序列數占第一總序列數和第二總序列數之和的比值,得到同一位置的測序序列的突變頻率;從第三SNP位點集中篩選出突變頻率低于75%的SNP位點,得到包含體細胞單核苷酸突變的SNP位點。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于天津諾禾致源生物信息科技有限公司,未經天津諾禾致源生物信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410708748.7/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種信息處理方法及電子設備
- 下一篇:氣道侵襲性曲霉病評分模型及其建立方法
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





