[發明專利]一種遺傳圖譜構建的處理方法和裝置無效
| 申請號: | 201210454569.6 | 申請日: | 2012-11-14 |
| 公開(公告)號: | CN102982251A | 公開(公告)日: | 2013-03-20 |
| 發明(設計)人: | 孔關義;王海龍;朱紅梅;周廣宇 | 申請(專利權)人: | 北京諾禾致源生物信息科技有限公司 |
| 主分類號: | G06F19/18 | 分類號: | G06F19/18 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 100083 北京市昌平區*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 遺傳 圖譜 構建 處理 方法 裝置 | ||
1.一種基于高通量測序數據構建遺傳圖譜的處理方法,其特征在于,包括:
接收多個樣本的SNP(單核苷酸多態性)數據;
鑒別基因組上發生重組的區域,將未發生重組的SNP位點合并成一個標記;
通過兩點測驗法構建基因組片段的連鎖群;
計算已知順序的標記之間的重組率及每一個連鎖群內未知順序的基因組片段之間的重組率;
根據標記之間及基因組片段之間的重組率對每一個連鎖群內的基因組片段進行排序;
依次計算排好序的連鎖群內相鄰標記之間的重組率并轉換成作圖距離,得到基因組遺傳圖譜及由排好順序的基因組組裝成的基因組片段。
2.根據權利要求1所述的處理方法,其特征在于,鑒別基因組上發生重組的區域,將未發生重組的SNP位點合并成一個標記包括:
每一個基因組片段上有許多個SNP位點,根據SNP位點在不同樣本之間的組合形式判定重組發生的位置;按照發生重組的位置將一個基因組片段分割成幾個區域,每個區域內的SNP整體當作一個標記或者說標記束。
3.根據權利要求1所述的處理方法,其特征在于,通過兩點測驗法構建基因組片段的連鎖群包括:
根據兩個非此即彼的假設,計算數據的整體或然性,以確定兩個基因組片段或是按一定的重組率而相互連鎖的可能性或是互不連鎖的可能性;這兩種可能性之比,是基因座實際上為連鎖的可能性;這個比率的常用對數就是對數優勢比;為了確定兩對基因之間是否存在連鎖,一般要求或然比大于1000:1,即LOD>3;而要否定連鎖存在,則要求或然比小于1:100,即LOD<-2;通過計算不同遺傳標記之間的LOD值,來確定基因組片段是否連鎖從而構建連鎖群。
4.根據權利要求1所述的處理方法,其特征在于,計算已知順序的標記之間的重組率及每一個連鎖群內未知順序的基因組片段之間的重組率包括:
每一個基因組片段上會包含一個或者多個遺傳標記,計算每兩個基因組片段內每對遺傳標記的重組率,并按照每個標記所占據基因組片段的長度分配每對遺傳標記之間的重組率占基因組片段之間重組率的比重;根據每對遺傳標記之間的重組率及其比重計算基因組片段之間的重組率;依次計算每兩個基因組片段之間的重組率。
5.根據權利要求1所述的處理方法,其特征在于,根據標記之間及基因組片段之間的重組率對每一個連鎖群內的基因組片段進行排序包括:
根據遺傳學規律,重組率越大的基因組片段距離越遠,從而對每個連鎖群內的基因組片段進行排序得到連鎖群內基因組片段的順序。
6.根據權利要求1所述的處理方法,其特征在于,依次計算排好序的連鎖群內相鄰標記之間的重組率并轉換成作圖距離,得到基因組遺傳圖譜及排好順序的基因組組裝成的基因組片段包括:
獲取每個連鎖群內部的基因組片段的順序及遺傳標記的順序;利用相鄰的2個標記在樣本里的不同組合依次計算各連鎖群內部相鄰遺傳標記之間的重組率;通過作圖公式將相鄰遺傳標記之間的重組率轉換成作圖距離;根據作圖距離依次排列遺傳標記即可得到基因組的遺傳圖譜及排好順序的基因組片段。
7.一種構建遺傳圖譜的處理裝置,其特征在于,包括:
接收單元,用于接收多個樣本SNP數據;
判定單元,與接收單元相連接,用于判定重組位點,將SNP整合成標記束;
構建單元,與判定單元相連接,用于構建連鎖群;
計算單元,與構建單元相連接,計算每一個連鎖群內遺傳標記及基因組片段間的重組率;
排序單元,與計算單元相連接,用于連鎖群內基因組片段的順序排列;
轉換單元,與排序單元相連接,與計算單元結合使用,用于將重組率轉換成作圖距離;
輸出單元,與轉換單元相連接,用于輸出遺傳圖譜信息及按順序排列的基因組片段。
8.根據權利要求7所述的處理裝置,其特征在于,計算單元包括:
獲取子單元,用于獲取SNP標記束在各個樣本中的形態信息,包括標記間發生重組個體數與未發生重組個體數;
重組率計算子單元,用于計算兩個標記之間的重組率;
比重分配單元,用于對基因組片段間的SNP標記對的重組率占基因組片段重組率的比重;
整合子單元,用于整合兩個基因組片段間SNP標記對的重組率及分配比重得到基因組片段間的重組率。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京諾禾致源生物信息科技有限公司,未經北京諾禾致源生物信息科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201210454569.6/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:軟件包信息統計及傳播方法
- 下一篇:觸發即時通信界面輸出的方法及客戶端
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





