[發明專利]一種遺傳圖譜構建的處理方法和裝置無效
| 申請號: | 201210454569.6 | 申請日: | 2012-11-14 |
| 公開(公告)號: | CN102982251A | 公開(公告)日: | 2013-03-20 |
| 發明(設計)人: | 孔關義;王海龍;朱紅梅;周廣宇 | 申請(專利權)人: | 北京諾禾致源生物信息科技有限公司 |
| 主分類號: | G06F19/18 | 分類號: | G06F19/18 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100083 北京市昌平區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 遺傳 圖譜 構建 處理 方法 裝置 | ||
技術領域
本發明涉及生物信息學領域,具體而言,涉及一種遺傳圖譜構建的處理方法和裝置。
背景技術
遺傳圖譜的構建建立在遺傳標記的基礎之上,以前我們利用限制性酶切位點多態性及簡單重復序列多態性等標記進行遺傳作圖。這些標記的數目一般都在幾千到一萬之間。隨著基因組測序技術的進步,單細胞測序技術迅速發展并日益成熟,我們可以一次性得到數以百萬計的單核苷酸多態性(Single?Nucleotide?Polymorphism,簡稱SNP),分子標記的增多使得遺傳標記的密度有了很大的提高。經典的遺傳圖譜構建方法和軟件顯得束手無策,因為基于隱馬氏鏈模型的最大似然方法計算復雜,需要很高的時間成本。這些問題目前尚未提出有效的解決方案。
針對這些問題,我們通過把遺傳標記整合成標記束,然后對標記束進行連鎖分析,用一種啟發式的算法對標記束排序,在短時間內得到精細的遺傳圖譜。
發明內容
本發明的主要目的在于提供一種遺傳圖譜構建的處理方法和裝置,以解決現有技術中無法使用更大數量級遺傳標記構建更精細的遺傳圖譜的問題。
為了實現上述目的,根據本發明的一個方面,提供了一種遺傳圖譜構建的處理方法,所述的方法包括下述步驟:
接收多個樣本的SNP(單核苷酸多態性)數據;
鑒別基因組上發生重組的區域,將未發生重組的SNP位點合并成一個標記;?
通過兩點測驗法構建基因組片段的連鎖群;
計算已知順序的標記之間的重組率及每一個連鎖群內未知順序的基因組片段之間的重組率;
根據標記之間及基因組片段之間的重組率對每一個連鎖群內的基因組片段進行排序;
依次計算排好序的連鎖群內相鄰標記之間的重組率并轉換成作圖距離,得到基因組遺傳圖譜及排好順序的基因組組裝成的基因組片段。
前述的一種遺傳圖譜構建的處理方法,其中所述的鑒別基因組上發生重組的區域,將未發生重組的SNP位點合并成一個標記包括:每一個基因組片段上有許多個SNP位點,根據SNP位點在不同樣本之間的組合形式判定重組發生的位置;按照發生重組的位置將一個基因組片段分割成幾個區域,每個區域內的SNP可以整體當作一個標記或者說標記束。
前述的一種遺傳圖譜構建的處理方法,其中所述的通過兩點測驗法構建基因組片段的連鎖群包括:遺傳學上通常用或然率的常用對數作為標準的衡量方法,該值的對數值稱為LOD值或對數優勢比:根據兩個非此即彼的假設,計算數據的整體或然性,以確定兩個基因組片段或是按一定的重組率而相互連鎖的可能性或是互不連鎖的可能性;這兩種可能性之比,是基因座實際上為連鎖的可能性;這個比率的常用對數就是對數優勢比;為了確定兩對基因之間是否存在連鎖,一般要求或然比大于1000:1,即LOD>3;而要否定連鎖存在,則要求或然小于1:100,即LOD<-2;通過計算不同遺傳標記之間的LOD值,來確定基因組片段是否連鎖從而構建連鎖群。
前述的一種遺傳圖譜構建的處理方法,其中所述的計算已知順序的標記之間的重組率及每一個連鎖群內未知順序的基因組片段之間的重組率包括:每一個基因組片段上會包含一個或者多個遺傳標記,計算每兩個基因組片段內每對遺傳標記的重組率,并按照每個標記所占據基因組片段的長度分配每對遺傳標記之間的重組率占基因組片段之間重組率的比重;根據每對遺傳標記之間的重組率極其比重計算基因組片段之間的重組率;依次計算每兩個基因組片段之間的重組率。
前述的一種遺傳圖譜構建的處理方法,其中所述的根據標記之間及基因組片段之間的重組率對每一個連鎖群內的基因組片段進行排序包括:根據遺傳學規律,重組率越大的基因組片段距離越遠,從而對每個連鎖群內的基因組片段進行排序得到連鎖群內基因組片段的順序。
前述的一種遺傳圖譜構建的處理方法,其中所述的依次計算排好序的連鎖群內相鄰標記之間的重組率并轉換成作圖距離,得到基因組遺傳圖譜及排好順序的基因組組裝成的基因組片段包括:獲取每個連鎖群內部的基因組片段的順序及遺傳標記的順序;利用相鄰的2個標記在樣本里的不同組合依次計算各連鎖群內部相鄰遺傳標記之間的重組率;通過作圖公式將相鄰遺傳標記之間的重組率轉換成作圖距離;根據作圖距離依次排列遺傳標記即可得到基因組的遺傳圖譜及排好順序的基因組片段。
為了實現上述目的,根據本發明的另一方面,提供了一種構建遺傳圖譜的處理裝置,該處理裝置用于執行上述本發明提供的構建遺傳圖譜的處理方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京諾禾致源生物信息科技有限公司,未經北京諾禾致源生物信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210454569.6/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:軟件包信息統計及傳播方法
- 下一篇:觸發即時通信界面輸出的方法及客戶端
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建?;蚍抡?,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





