[發(fā)明專利]一種單核苷酸多態(tài)性檢測(cè)方法有效
| 申請(qǐng)?zhí)枺?/td> | 200810218343.X | 申請(qǐng)日: | 2008-12-12 |
| 公開(公告)號(hào): | CN101539967A | 公開(公告)日: | 2009-09-23 |
| 發(fā)明(設(shè)計(jì))人: | 李英睿;李瑞強(qiáng);方曉東;李松崗;余昶;王俊;楊煥明;汪建 | 申請(qǐng)(專利權(quán))人: | 深圳華大基因研究院;深圳華大基因科技有限公司 |
| 主分類號(hào): | G06F19/00 | 分類號(hào): | G06F19/00;C12Q1/68 |
| 代理公司: | 深圳中一專利商標(biāo)事務(wù)所 | 代理人: | 張全文 |
| 地址: | 518083廣東*** | 國(guó)省代碼: | 廣東;44 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 核苷酸 多態(tài)性 檢測(cè) 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明屬于生物工程領(lǐng)域,尤其涉及一種單核苷酸多態(tài)性檢測(cè)方法和系統(tǒng)。
背景技術(shù)
單核苷酸多態(tài)性(Single?Nucleotide?Polymorphism,SNP),即指由于單個(gè)核苷酸堿基的改變而導(dǎo)致的核酸序列的多態(tài)性。在不同個(gè)體的同一條染色體或同一位點(diǎn)的核苷酸序列中,絕大多數(shù)核苷酸序列一致而只有一個(gè)堿基不同的現(xiàn)象,就是SNP。由于SNP在人類基因組中數(shù)量較多,發(fā)生頻率較高,因此被認(rèn)為是繼微衛(wèi)星之后的新一代遺傳學(xué)標(biāo)記,在醫(yī)學(xué)遺傳學(xué)、藥物遺傳學(xué)、疾病遺傳學(xué)、疾病診斷學(xué)、以及人類進(jìn)化等研究領(lǐng)域都有很高的研究?jī)r(jià)值和應(yīng)用前景。
二十多年以來,Sanger法測(cè)序和熒光電泳技術(shù)一直在DNA測(cè)序領(lǐng)域占據(jù)著主導(dǎo)地位,使用隨機(jī)鳥槍法策略或目標(biāo)區(qū)域的PCR擴(kuò)增法進(jìn)行了大量的SNP檢測(cè)。現(xiàn)有dbSNP數(shù)據(jù)庫中的大多數(shù)SNP位點(diǎn)都是通過這些方法鑒定的。鳥槍法測(cè)序進(jìn)行SNP檢測(cè)的標(biāo)準(zhǔn)方法是將測(cè)序片段與基因組參考序列進(jìn)行比對(duì),并根據(jù)堿基的質(zhì)量打分來過濾掉低質(zhì)量的測(cè)序錯(cuò)誤,得到較為可信的SNP結(jié)果。使用來自二倍體樣本的PCR擴(kuò)增序列進(jìn)行直接測(cè)序,再通過對(duì)色譜圖進(jìn)行分析,檢測(cè)出雜合的多態(tài)性位點(diǎn),也是常見的方法,主要軟件有SNPdetector,novoSNP,PolyPhred以及PolyScan。
與傳統(tǒng)的毛細(xì)管電泳法測(cè)序相比,新一代測(cè)序技術(shù)如Illumina?GenomeAnalyzer(GA),AB?SOLiD,以及Roche?454FLX系統(tǒng)顯著地提高了測(cè)序通量,極大地降低了成本。Illumina?GA一次運(yùn)行可以產(chǎn)生約四千萬條長(zhǎng)度為50bp的測(cè)序片段。這種超高的測(cè)序通量使得新一代的測(cè)序技術(shù)特別適合于在已知參考基因組序列的基礎(chǔ)上進(jìn)行大規(guī)模個(gè)體的重測(cè)序,從而進(jìn)行基因變異的研究。截至當(dāng)前,使用新的測(cè)序技術(shù)已經(jīng)完成了兩個(gè)人的基因組測(cè)序:James?Watson的個(gè)人基因組測(cè)序(Roche?454FLX)和第一個(gè)亞洲人的基因組測(cè)序(Illumina?GA)。此外,國(guó)際千人基因組計(jì)劃執(zhí)行委員會(huì)也決定使用這種測(cè)序技術(shù)對(duì)來自全世界的1000個(gè)個(gè)體基因組進(jìn)行測(cè)序,得到最詳細(xì)的人類基因組變異圖譜。
隨著新的測(cè)序技術(shù)的發(fā)展,相應(yīng)的SNP檢測(cè)方法也有了很好的發(fā)展,然而,由于新測(cè)序技術(shù)產(chǎn)生的測(cè)序片段與以往相比有顯著的差異,因此現(xiàn)有的SNP測(cè)序方法難以滿足高通量測(cè)序技術(shù)的要求。
發(fā)明內(nèi)容
本發(fā)明的目的在于提供一種單核苷酸多態(tài)性檢測(cè)方法,旨在解決現(xiàn)有的單核苷酸多態(tài)性檢測(cè)方法難以滿足高通量測(cè)序技術(shù)的要求的問題。
本發(fā)明是這樣實(shí)現(xiàn)的,一種單核苷酸多態(tài)性檢測(cè)方法,所述方法包括下述步驟:
將高通量測(cè)序技術(shù)得到的測(cè)序片段比對(duì)到參考基因組序列上;
將測(cè)序得到的待測(cè)基因組中每個(gè)堿基的測(cè)序質(zhì)量分?jǐn)?shù)轉(zhuǎn)換為堿基錯(cuò)配率,并根據(jù)比對(duì)到參考基因組上的每個(gè)位點(diǎn)的所有測(cè)序片段堿基的錯(cuò)配率之積,得到待測(cè)基因組上對(duì)應(yīng)位點(diǎn)的各種基因型的似然概率;
根據(jù)所述似然概率和為每種基因型預(yù)設(shè)的先驗(yàn)概率,計(jì)算參考基因組上每個(gè)位點(diǎn)上每種基因型的后驗(yàn)概率,并將后驗(yàn)概率最高的基因型確定為待測(cè)基因組對(duì)應(yīng)位點(diǎn)最有可能正確的基因型,得到待測(cè)基因組的一致序列;
檢測(cè)待測(cè)基因組的一致序列中與參考基因組序列不一致的位點(diǎn),得到待測(cè)基因組中的多態(tài)性位點(diǎn)。
在本發(fā)明實(shí)施例中,根據(jù)測(cè)序片段的質(zhì)量分?jǐn)?shù)計(jì)算得到待測(cè)基因組上對(duì)應(yīng)位點(diǎn)的各種基因型的似然概率,再根據(jù)似然概率和為每種基因型預(yù)設(shè)的先驗(yàn)概率,計(jì)算參考基因組上每個(gè)位點(diǎn)上每種基因型的后驗(yàn)概率,并將后驗(yàn)概率最高的基因型確定為待測(cè)基因組對(duì)應(yīng)位點(diǎn)最有可能正確的基因型,得到待測(cè)基因組的一致序列,檢測(cè)待測(cè)基因組的一致序列中與參考基因組序列不一致的位點(diǎn),得到待測(cè)基因組中的單核苷酸中的多態(tài)性位點(diǎn)。本發(fā)明實(shí)施例在檢測(cè)單核苷酸多態(tài)性時(shí)考慮了先驗(yàn)概率對(duì)檢測(cè)結(jié)果的影響,從而使本發(fā)明實(shí)施例的檢測(cè)結(jié)果更準(zhǔn)確,適用于高通量測(cè)序技術(shù)。
附圖說明
圖1是本發(fā)明實(shí)施例提供的單核苷酸多態(tài)性檢測(cè)方法的實(shí)現(xiàn)流程圖;
圖2是本發(fā)明另一實(shí)施例提供的單核苷酸多態(tài)性檢測(cè)方法的實(shí)現(xiàn)流程圖;
圖3a至圖3d是測(cè)序片段比對(duì)的準(zhǔn)確性和唯一性示意圖;
圖4a和圖4b本發(fā)明實(shí)施例提供的測(cè)序質(zhì)量分?jǐn)?shù)的不準(zhǔn)確性和錯(cuò)配的偏向性示意圖;
圖5是本發(fā)明實(shí)施例提供的測(cè)序質(zhì)量分?jǐn)?shù)校正前后的起點(diǎn)數(shù)目分布示意圖;
圖6是本發(fā)明實(shí)施例提供的在不同質(zhì)量閥值下全基因組覆蓋度、基因分型位點(diǎn)的覆蓋度和錯(cuò)誤率示意圖。
具體實(shí)施方式
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于深圳華大基因研究院;深圳華大基因科技有限公司,未經(jīng)深圳華大基因研究院;深圳華大基因科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/200810218343.X/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F19-00 專門適用于特定應(yīng)用的數(shù)字計(jì)算或數(shù)據(jù)處理的設(shè)備或方法
G06F19-10 .生物信息學(xué),即計(jì)算分子生物學(xué)中的遺傳或蛋白質(zhì)相關(guān)的數(shù)據(jù)處理方法或系統(tǒng)
G06F19-12 ..用于系統(tǒng)生物學(xué)的建?;蚍抡?,例如:概率模型或動(dòng)態(tài)模型,遺傳基因管理網(wǎng)絡(luò),蛋白質(zhì)交互作用網(wǎng)絡(luò)或新陳代謝作用網(wǎng)絡(luò)
G06F19-14 ..用于發(fā)展或進(jìn)化的,例如:進(jìn)化的保存區(qū)域決定或進(jìn)化樹結(jié)構(gòu)
G06F19-16 ..用于分子結(jié)構(gòu)的,例如:結(jié)構(gòu)排序,結(jié)構(gòu)或功能關(guān)系,蛋白質(zhì)折疊,結(jié)構(gòu)域拓?fù)洌媒Y(jié)構(gòu)數(shù)據(jù)的藥靶,涉及二維或三維結(jié)構(gòu)的
G06F19-18 ..用于功能性基因組學(xué)或蛋白質(zhì)組學(xué)的,例如:基因型–表型關(guān)聯(lián),不均衡連接,種群遺傳學(xué),結(jié)合位置鑒定,變異發(fā)生,基因型或染色體組的注釋,蛋白質(zhì)相互作用或蛋白質(zhì)核酸的相互作用
- 具有增強(qiáng)的結(jié)合特異性的多核苷酸探針,其上固定有該探針的微陣列及設(shè)計(jì)該探針的方法
- 包含單核苷酸多態(tài)性且與結(jié)腸癌有關(guān)的多核苷酸、包括該多核苷酸的微陣列和診斷試劑盒以及用該多核苷酸診斷結(jié)腸癌的方法
- 突變AOX1啟動(dòng)子
- 用于擴(kuò)增丙型肝炎病毒核酸的方法
- 具有通用元件的基于熒光團(tuán)的寡核苷酸探針
- 寡核苷酸及其用途
- 一種抑制埃博拉病毒的核酸、含有該核酸的藥物組合物及其用途
- 雙鏈寡核苷酸、含雙鏈寡核苷酸的組合物與綴合物及制備方法和用途
- 超敏檢測(cè)NAs治療下乙型肝炎病毒DNA的寡核苷酸組合物、試劑盒、方法及用途
- 用于檢測(cè)胃癌的試劑盒及其應(yīng)用
- CYP3A基因的多態(tài)性檢測(cè)用探針、多態(tài)性檢測(cè)方法、藥效評(píng)價(jià)方法以及多態(tài)性檢測(cè)用試劑盒
- 多態(tài)性檢測(cè)用探針、多態(tài)性檢測(cè)方法、藥效判定方法以及多態(tài)性檢測(cè)用試劑盒
- 多態(tài)性檢測(cè)用探針、多態(tài)性檢測(cè)方法、藥效判定方法以及多態(tài)性檢測(cè)用試劑盒
- 慢性牙周炎相關(guān)單核苷酸多態(tài)性檢測(cè)用探針和引物、及其試劑盒
- 一種開發(fā)煙草中具多態(tài)性SSR分子標(biāo)記的方法
- 一種用于檢測(cè)UGT1A1基因多態(tài)性的引物、探針、試劑盒及檢測(cè)方法
- 大瀧六線魚單核苷酸多態(tài)性位點(diǎn)及引物
- 一種焦磷酸測(cè)序法檢測(cè)腸促胰素作用相關(guān)的單核苷酸多態(tài)性的試劑盒及方法
- 氨基糖苷類藥物相關(guān)12s rRNA基因突變位點(diǎn)檢測(cè)試劑盒
- 伊立替康的治療效果預(yù)測(cè)方法及應(yīng)用該方法的試劑盒
- 檢測(cè)裝置、檢測(cè)方法和檢測(cè)組件
- 檢測(cè)方法、檢測(cè)裝置和檢測(cè)系統(tǒng)
- 檢測(cè)裝置、檢測(cè)方法以及記錄介質(zhì)
- 檢測(cè)設(shè)備、檢測(cè)系統(tǒng)和檢測(cè)方法
- 檢測(cè)芯片、檢測(cè)設(shè)備、檢測(cè)系統(tǒng)和檢測(cè)方法
- 檢測(cè)裝置、檢測(cè)設(shè)備及檢測(cè)方法
- 檢測(cè)芯片、檢測(cè)設(shè)備、檢測(cè)系統(tǒng)
- 檢測(cè)組件、檢測(cè)裝置以及檢測(cè)系統(tǒng)
- 檢測(cè)裝置、檢測(cè)方法及檢測(cè)程序
- 檢測(cè)電路、檢測(cè)裝置及檢測(cè)系統(tǒng)
- 一種數(shù)據(jù)庫讀寫分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





