[發明專利]基于克隆DNA混合池的全基因組測序方法有效
| 申請號: | 201310288791.8 | 申請日: | 2013-07-10 |
| 公開(公告)號: | CN103388025A | 公開(公告)日: | 2013-11-13 |
| 發明(設計)人: | 羅美中;潘永龍 | 申請(專利權)人: | 華中農業大學 |
| 主分類號: | C12Q1/68 | 分類號: | C12Q1/68 |
| 代理公司: | 武漢開元知識產權代理有限公司 42104 | 代理人: | 王和平 |
| 地址: | 430070 湖*** | 國省代碼: | 湖北;42 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 克隆 dna 混合 基因組 方法 | ||
1.基于克隆DNA混合池的全基因組測序方法,其特征在于:包括以下步驟:
1)提取全基因組DNA,構建BAC文庫;
2)構建BAC克隆混合池;
3)提取BAC克隆混合池的DNA;
4)對步驟3)中的BAC克隆混合池的DNA利用NGS進行雙末端測序;
5)掃描各個混合池的序列,獲得各個混合池的特征序列集合與k-mer集合;
6)根據混合池的特征序列集合與k-mer集合,解析出各個克隆的特征序列集合與k-mer集合;
7)利用克隆的特征序列集合構建克隆重疊群;
8)利用克隆重疊群將克隆的k-mer集合分割成小的k-mer集合并定位到克隆重疊群上;
9)對步驟4)中混合池的NGS序列進行拼裝得到序列重疊群;
10)將序列重疊群定位到克隆重疊群上,并利用測序的雙末端信息連接序列重疊群,確定它們的方向,得到克隆重疊群的序列;
11)利用分子標記確定克隆重疊群的相對位置與方向,將克隆重疊群的序列連接成整條染色體序列,得到全基因組序列;
其中,關于克隆特征序列集合與k-mer集合的解析的總算法如下:
某一物種BAC文庫的克隆總數為a,構建的混合池總數為x,則;
第κ維,索引為λ混合池的k-mer集合表示為:P(κ,λ);
包含某一給定克隆的混合池的k-mer集合為:{P(δ)|δ<m,?P(δ)∈P};
包含同一克隆的混合池的k-mer集合的交集,即克隆的IKS為:
某一克隆在混合池中的排除并集EUKS為:;
某一克隆k-mer集合的所有排除并集的交集為:;
某一克隆的最終k-mer集合FKS為:CF=Cx-CIx。
2.根據權利要求1所述的基于克隆DNA混合池的全基因組測序方法,其特征在于:所述序列重疊群定位與整合算法如下:
1)克隆重疊群的分割
根據克隆重疊群中克隆的相對位置,將克隆的k-mer集合分割成更小的區塊,假設有兩個克隆屬于同一個重疊群并相互重疊,其中集合A為其中一個克隆的k-mer集合,集合B為另一個克隆的k-mer集合,那么這兩個克隆的k-mer集合可以分解成3個子集,即共有的k-mer集合(A∩B),A特有的k-mer集合(A-B)和B特有的k-mer集合(B-A)。兩者共有的k-mer集合位于它們特有的k-mer集合之間,這樣三個k-mer的相對位置就確定了,根據這一算法,對每一個克隆重疊群的所有的克隆,按照它們相對位置,從一端開始逐一分割,從而將一個克隆重疊群中所有克隆的k-mer集合分割成小的子集,并且這些子集的相對位置是確定;
2)序列定位與整合
對各個混合池的NGS序列利用短序列拼裝軟件如velvet分別進行拼裝,再將拼裝結果合并,利用長序列拼裝軟件如PCAP進行進一步拼裝,得到序列重疊群,然后將每一個序列重疊群分解成k-mer集合,與上一步得到的所有小區塊的k-mer集合求交集,找出其中交集元素總數最多的區塊,這樣就將序列重疊群定位到了克隆重疊區的小區塊上,如果定位到的同一個克隆重疊群的序列包含有相互重疊的部分,則需要分別再次拼裝合并相互重疊的序列,然后再次定位合并后的序列。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于華中農業大學,未經華中農業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201310288791.8/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:濕法球磨聯合酶法提取黑豆多肽的方法
- 下一篇:高精強力液壓機





