[發(fā)明專利]一種基于大數(shù)據(jù)的染色體異常位點的篩選方法在審
| 申請?zhí)枺?/td> | 201710492071.1 | 申請日: | 2017-06-26 |
| 公開(公告)號: | CN107194206A | 公開(公告)日: | 2017-09-22 |
| 發(fā)明(設(shè)計)人: | 沈雨后 | 申請(專利權(quán))人: | 思暢信息科技(上海)有限公司 |
| 主分類號: | G06F19/22 | 分類號: | G06F19/22;G06F19/28 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 201800 上海市崇明縣長興鎮(zhèn)潘園公*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 數(shù)據(jù) 染色體 異常 篩選 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及基因工程技術(shù)領(lǐng)域,特別是涉及一種基于大數(shù)據(jù)的染色體異常位點的篩選方法。
背景技術(shù)
單核苷酸多態(tài)性(single nucleotide polymorphism, SNP)位點,是指在基因組上單個核苷酸的變異形成的遺傳標(biāo)記,其數(shù)量很多,多態(tài)性豐富。單核苷酸多態(tài)性,主要是指在基因組水平上由單個核苷酸的變異所引起的DNA序列多態(tài)性。它是人類可遺傳的變異中最常見的一種,占所有已知多態(tài)性的90%以上。單核苷酸多態(tài)性在人類基因組中廣泛存在,平均每500~1000個堿基對中就有1個,估計其總數(shù)可達(dá)300萬個甚至更多。
對目標(biāo)區(qū)域通過一定的算法或者軟件運算可以得到目標(biāo)區(qū)域中潛在的單核苷酸多態(tài)性位點,在所得到的這些單核苷酸多態(tài)性位點中通常很難對找到的位點進(jìn)行異常驗證,如何從數(shù)以千計的單核苷酸多態(tài)性位點中精確篩選出異常位點是現(xiàn)在面臨的一個難題。
發(fā)明內(nèi)容
為克服現(xiàn)有技術(shù)的不足,本發(fā)明的目的在于提供一種基于大數(shù)據(jù)的、能夠精準(zhǔn)、快速篩選出染色體異常位點的篩選方法。
為實現(xiàn)上述目的,本發(fā)明通過以下技術(shù)方案實現(xiàn):
一種基于大數(shù)據(jù)的染色體異常位點的篩選方法,包括如下步驟:
建立數(shù)據(jù)庫:以預(yù)設(shè)疾病名稱結(jié)合多態(tài)性、META分析、單核苷酸多態(tài)性、遺傳性變異、GWAS分析中的至少一個作為關(guān)鍵詞,在PubMed數(shù)據(jù)庫中檢索文獻(xiàn),根據(jù)所檢索文獻(xiàn)的摘要篩選出符合預(yù)設(shè)條件的相關(guān)聯(lián)文獻(xiàn),將所述相關(guān)聯(lián)文獻(xiàn)下載到計算機的存儲器,建立一個數(shù)據(jù)庫;
確定位點的比值比:獲取所述數(shù)據(jù)庫中與所述預(yù)設(shè)疾病相關(guān)的所有位點的信息,從所述相關(guān)聯(lián)文獻(xiàn)的內(nèi)容中確定出所述位點的比值比;
核查位點的頻率:在HapMap數(shù)據(jù)庫中輸入所述位點,確定出在預(yù)設(shè)人群范圍內(nèi)所述HapMap數(shù)據(jù)庫中所述位點對應(yīng)基因型的研究頻率,剔除沒有頻率以及最小等位基因頻率小于3%的位點;將經(jīng)剔除后保留的位點作為預(yù)設(shè)異常位點,將所述預(yù)設(shè)異常位點的比值比和頻率匯總;
預(yù)實驗驗證:按照所述預(yù)設(shè)異常位點前后的序列,從NCBI中獲取所述預(yù)設(shè)異常位點前后的序列片段,根據(jù)所述預(yù)設(shè)異常位點前后的序列片段設(shè)計PCR引物、探針;選取細(xì)胞樣本并進(jìn)行DNA抽提,采用RT-PCR技術(shù)進(jìn)行DNA分型并進(jìn)行數(shù)據(jù)分析,若數(shù)據(jù)分析顯示出預(yù)設(shè)分型結(jié)果,則將所述預(yù)設(shè)異常位點確定為異常位點。
進(jìn)一步的,所述確定位點的比值比具體包括:從所述相關(guān)聯(lián)文獻(xiàn)的內(nèi)容中確定出與位點的比值比的相關(guān)數(shù)據(jù),對所述相關(guān)數(shù)據(jù)進(jìn)行處理,確定出所述位點的比值比。
進(jìn)一步的,所述關(guān)鍵詞還包括預(yù)設(shè)人群范圍,以限定檢索的范圍。
有益效果:利用大數(shù)據(jù)建立數(shù)據(jù)庫,以一些特殊的關(guān)鍵詞來檢索,將與預(yù)設(shè)條件的相關(guān)聯(lián)文獻(xiàn)全部下載下來,確定位點的比值比,然后核查位點的頻率,再將剔除后保留的位點作為預(yù)設(shè)異常位點,最后通過預(yù)實驗驗證的方式,最終確認(rèn)出異常位點。按照預(yù)設(shè)異常位點前后的序列,從NCBI中獲取所述預(yù)設(shè)異常位點前后的序列片段,根據(jù)所述預(yù)設(shè)異常位點前后的序列片段設(shè)計PCR引物、探針;選取細(xì)胞樣本并進(jìn)行DNA抽提,采用RT-PCR技術(shù)進(jìn)行DNA分型,進(jìn)行數(shù)據(jù)分析,若數(shù)據(jù)分析顯示出預(yù)設(shè)分型結(jié)果,則將所述預(yù)設(shè)異常位點確定為異常位點,該驗證手段保證了精準(zhǔn)度。
具體實施方式
下面對本發(fā)明做進(jìn)一步的詳細(xì)說明,以令本領(lǐng)域技術(shù)人員參照說明書文字能夠據(jù)以實施。
一種基于大數(shù)據(jù)的染色體異常位點的篩選方法,包括如下步驟:
建立數(shù)據(jù)庫:以預(yù)設(shè)疾病名稱結(jié)合多態(tài)性(polymorphism)、META分析(meta)、單核苷酸多態(tài)性(single nucleotide polymorphism,SNP)、遺傳性變異(genetic variant)、GWAS分析(Genome-wide association study,GWAS)中的至少一個作為關(guān)鍵詞,在PubMed數(shù)據(jù)庫中檢索文獻(xiàn),根據(jù)所檢索文獻(xiàn)的摘要篩選出符合預(yù)設(shè)條件的相關(guān)聯(lián)文獻(xiàn),將相關(guān)聯(lián)文獻(xiàn)下載到計算機的存儲器,建立一個數(shù)據(jù)庫;
關(guān)鍵詞示例:
(1)預(yù)設(shè)疾病名稱+多態(tài)性;
(2)預(yù)設(shè)疾病名稱+單核苷酸多態(tài)性;疾病名稱+GWAS分析;
(3)預(yù)設(shè)疾病名稱+多態(tài)性+META分析;
(4)預(yù)設(shè)疾病名稱+單核苷酸多態(tài)性+META分析;
(5)預(yù)設(shè)疾病名稱+遺傳性變異;
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于思暢信息科技(上海)有限公司,未經(jīng)思暢信息科技(上海)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710492071.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F19-00 專門適用于特定應(yīng)用的數(shù)字計算或數(shù)據(jù)處理的設(shè)備或方法
G06F19-10 .生物信息學(xué),即計算分子生物學(xué)中的遺傳或蛋白質(zhì)相關(guān)的數(shù)據(jù)處理方法或系統(tǒng)
G06F19-12 ..用于系統(tǒng)生物學(xué)的建模或仿真,例如:概率模型或動態(tài)模型,遺傳基因管理網(wǎng)絡(luò),蛋白質(zhì)交互作用網(wǎng)絡(luò)或新陳代謝作用網(wǎng)絡(luò)
G06F19-14 ..用于發(fā)展或進(jìn)化的,例如:進(jìn)化的保存區(qū)域決定或進(jìn)化樹結(jié)構(gòu)
G06F19-16 ..用于分子結(jié)構(gòu)的,例如:結(jié)構(gòu)排序,結(jié)構(gòu)或功能關(guān)系,蛋白質(zhì)折疊,結(jié)構(gòu)域拓?fù)洌媒Y(jié)構(gòu)數(shù)據(jù)的藥靶,涉及二維或三維結(jié)構(gòu)的
G06F19-18 ..用于功能性基因組學(xué)或蛋白質(zhì)組學(xué)的,例如:基因型–表型關(guān)聯(lián),不均衡連接,種群遺傳學(xué),結(jié)合位置鑒定,變異發(fā)生,基因型或染色體組的注釋,蛋白質(zhì)相互作用或蛋白質(zhì)核酸的相互作用
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 一種鑒定植物遠(yuǎn)緣雜交種中外源染色體和染色體片段的方法
- 一種基于深度學(xué)習(xí)的重疊染色體分割方法及裝置
- 一種基于條帶識別的染色體排序方法
- 一種染色體切割數(shù)據(jù)的處理方法、系統(tǒng)和存儲介質(zhì)
- 彎曲染色體圖像拉直模型生成方法、模型的應(yīng)用、系統(tǒng)、可讀存儲介質(zhì)及計算機設(shè)備
- 染色體嵌合體識別判斷方法、系統(tǒng)及染色體核型分析方法
- 染色體核型圖優(yōu)選拼接方法、系統(tǒng)及染色體核型分析方法
- 自動染色體核型分析方法、系統(tǒng)和存儲介質(zhì)
- 染色體異常檢測裝置
- 一種染色體核型分析中染色體分割方法





