[發(fā)明專利]一種單核苷酸多態(tài)性檢測方法有效
| 申請?zhí)枺?/td> | 200810218343.X | 申請日: | 2008-12-12 |
| 公開(公告)號: | CN101539967A | 公開(公告)日: | 2009-09-23 |
| 發(fā)明(設計)人: | 李英睿;李瑞強;方曉東;李松崗;余昶;王俊;楊煥明;汪建 | 申請(專利權(quán))人: | 深圳華大基因研究院;深圳華大基因科技有限公司 |
| 主分類號: | G06F19/00 | 分類號: | G06F19/00;C12Q1/68 |
| 代理公司: | 深圳中一專利商標事務所 | 代理人: | 張全文 |
| 地址: | 518083廣東*** | 國省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 核苷酸 多態(tài)性 檢測 方法 | ||
1.一種單核苷酸多態(tài)性檢測方法,其特征在于,所述方法包括下述步驟:
將高通量測序技術(shù)得到的測序片段比對到參考基因組序列上;
將測序得到的待測基因組中每個堿基的測序質(zhì)量分數(shù)轉(zhuǎn)換為堿基錯配率,并根據(jù)比對到參考基因組上的每個位點的所有測序片段堿基的錯配率之積,得到待測基因組上對應位點的各種基因型的似然概率;
根據(jù)所述似然概率和為每種基因型預設的先驗概率,計算參考基因組上每個位點上每種基因型的后驗概率,并將后驗概率最高的基因型確定為待測基因組對應位點最有可能正確的基因型,得到待測基因組的一致序列;
檢測待測基因組的一致序列中與參考基因組序列不一致的位點,得到待測基因組中的多態(tài)性位點。
2.如權(quán)利要求1所述的方法,其特征在于,在所述將測序得到的待測基因組中每個堿基的測序質(zhì)量分數(shù)轉(zhuǎn)換為堿基錯配率,并根據(jù)比對到參考基因組上的每個位點的所有測序片段堿基的錯配率之積,得到待測基因組上對應位點的各種基因型的似然概率的步驟之前,所述方法還包括下述步驟:
對測序得到的待測基因組中每個堿基的測序質(zhì)量分數(shù)進行校正。
3.如權(quán)利要求2所述的方法,其特征在于,所述對測序得到的待測基因組中每個堿基的測序質(zhì)量分數(shù)進行校正的步驟具體為:
根據(jù)唯一比對到參考基因組序列的測序片段,統(tǒng)計特定測序質(zhì)量分數(shù)和測序序列坐標下每兩種堿基之間的錯配比例,將所述錯配比例作為錯配率的估計,記錄在四維概率矩陣中;
對于參考基因組上每一個位點,收集比對在該位點上所有的測序片段的堿基,并記錄其堿基類型、測序質(zhì)量分數(shù)和在測序片段上的序列坐標,從四維概率矩陣中查出四種堿基觀察到測序堿基的概率。
4.如權(quán)利要求3所述的方法,其特征在于,在所述根據(jù)唯一比對到參考基因組序列的測序片段,統(tǒng)計特定測序質(zhì)量分數(shù)和測序序列坐標下每兩種堿基之間的錯配比例,將所述錯配比例作為錯配率的估計,記錄在四維概率矩陣中的步驟之前,所述方法還包括下述步驟:
過濾掉已知的單核苷酸多態(tài)性位點。
5.如權(quán)利要求3所述的方法,其特征在于,當比對到參考基因組上的測序片段中有N個相同測序片段,且所述N個相同測序片段在參考基因組上定位相同時,所述N為正整數(shù),所述方法還包括:
當?shù)贜條測序片段比對到參考基因組的位點時,將從四維概率矩陣中查出四種堿基觀察到測序堿基的概率×校正因子(N-1)后的積進行概率歸一化后,得到待測基因組上對應位點的各種基因型的似然概率。
6.如權(quán)利要求3所述的方法,其特征在于,所述將測序得到的待測基因組中每個堿基的測序質(zhì)量分數(shù)轉(zhuǎn)換為堿基錯配率,并根據(jù)比對到參考基因組上的每個位點的所有測序片段堿基的錯配率之積,得到待測基因組上對應位點的各種基因型的似然概率的步驟具體為:
根據(jù)從四維概率矩陣中查出的每一種真實基因型觀察到每一個單獨堿基的概率之積,得到待測基因組上對應位點的各種基因型的似然概率。
7.如權(quán)利要求1至6任一權(quán)利要求所述的方法,其特征在于,所述方法還包括下述步驟:
將后驗概率最高的基因型確定為待測基因組對應位點最有可能正確的基因型時,所述基因型正確的概率為所述基因型的后驗概率在對應位點每種基因型的后驗概率之和中所占的比例;
將所述基因型正確的概率轉(zhuǎn)換為質(zhì)量分數(shù),并通過對質(zhì)量分數(shù)設置閥值,過濾掉檢測出的潛在多態(tài)性位點中質(zhì)量分數(shù)小于設置的閥值的多態(tài)性位點。
8.如權(quán)利要求1至6任一權(quán)利要求所述的方法,其特征在于,所述方法還包括下述步驟:
對支持多態(tài)性堿基型的測序片段的數(shù)目設定閥值,過濾掉支持多態(tài)性堿基型的測序片段的數(shù)目小于預設閥值的多態(tài)性位點。
9.如權(quán)利要求1至6任一權(quán)利要求所述的方法,其特征在于,所述方法還包括下述步驟:
比較檢測出的多態(tài)性位點之間的距離,并過濾掉距離小于預設閥值的多態(tài)性位點。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳華大基因研究院;深圳華大基因科技有限公司,未經(jīng)深圳華大基因研究院;深圳華大基因科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200810218343.X/1.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字數(shù)據(jù)處理
G06F19-00 專門適用于特定應用的數(shù)字計算或數(shù)據(jù)處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質(zhì)相關的數(shù)據(jù)處理方法或系統(tǒng)
G06F19-12 ..用于系統(tǒng)生物學的建模或仿真,例如:概率模型或動態(tài)模型,遺傳基因管理網(wǎng)絡,蛋白質(zhì)交互作用網(wǎng)絡或新陳代謝作用網(wǎng)絡
G06F19-14 ..用于發(fā)展或進化的,例如:進化的保存區(qū)域決定或進化樹結(jié)構(gòu)
G06F19-16 ..用于分子結(jié)構(gòu)的,例如:結(jié)構(gòu)排序,結(jié)構(gòu)或功能關系,蛋白質(zhì)折疊,結(jié)構(gòu)域拓撲,用結(jié)構(gòu)數(shù)據(jù)的藥靶,涉及二維或三維結(jié)構(gòu)的
G06F19-18 ..用于功能性基因組學或蛋白質(zhì)組學的,例如:基因型–表型關聯(lián),不均衡連接,種群遺傳學,結(jié)合位置鑒定,變異發(fā)生,基因型或染色體組的注釋,蛋白質(zhì)相互作用或蛋白質(zhì)核酸的相互作用
- CYP3A基因的多態(tài)性檢測用探針、多態(tài)性檢測方法、藥效評價方法以及多態(tài)性檢測用試劑盒
- 多態(tài)性檢測用探針、多態(tài)性檢測方法、藥效判定方法以及多態(tài)性檢測用試劑盒
- 多態(tài)性檢測用探針、多態(tài)性檢測方法、藥效判定方法以及多態(tài)性檢測用試劑盒
- 慢性牙周炎相關單核苷酸多態(tài)性檢測用探針和引物、及其試劑盒
- 一種開發(fā)煙草中具多態(tài)性SSR分子標記的方法
- 一種用于檢測UGT1A1基因多態(tài)性的引物、探針、試劑盒及檢測方法
- 大瀧六線魚單核苷酸多態(tài)性位點及引物
- 一種焦磷酸測序法檢測腸促胰素作用相關的單核苷酸多態(tài)性的試劑盒及方法
- 氨基糖苷類藥物相關12s rRNA基因突變位點檢測試劑盒
- 伊立替康的治療效果預測方法及應用該方法的試劑盒





