[發明專利]一種基因組完成圖的基因組組裝方法在審
| 申請號: | 202110069693.X | 申請日: | 2021-01-19 |
| 公開(公告)號: | CN112786109A | 公開(公告)日: | 2021-05-11 |
| 發明(設計)人: | 盧山;李奎 | 申請(專利權)人: | 南京大學 |
| 主分類號: | G16B30/20 | 分類號: | G16B30/20;G16B30/00;G16B45/00 |
| 代理公司: | 北京眾合誠成知識產權代理有限公司 11246 | 代理人: | 劉珊珊 |
| 地址: | 210000 江蘇*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基因組 完成 組裝 方法 | ||
1.一種基因組完成圖的基因組組裝方法,其特征在于,包括以下步驟:
步驟1,使用高保真測序數據HiFi進行基因組組裝,生成重疊群以及重疊群在字符串圖中的重疊群路徑、邊信息和重疊信息;
步驟2,將重疊群錨定在參考基因組的染色體上,得到錨定結果,錨定結果包括參考基因組的每個染色體上重疊群的位置和方向;
步驟3,將步驟1中生成的重疊群在字符串圖中的重疊群路徑按照步驟2的錨定結果連接成每個染色體在字符串圖中的染色體路徑;每個染色體路徑由重疊群路徑和它們之間的缺口表示;如果兩個重疊群相鄰,則它們之間將沒有缺口;
步驟4,使用步驟1中生成的邊信息和重疊信息重建字符串圖得到重建后字符串圖;對于每條染色體,按照步驟3得到的染色體路徑遍歷步驟1生成的重疊群,并在重建后字符串圖上為每一對之間的缺口尋找最短路徑并填補缺口,以實現無缺口的組裝。
2.根據權利要求1所述基因組完成圖的基因組組裝方法,其特征在于:步驟2中將重疊群錨定在參考基因組的染色體上的方法為遺傳圖譜法、高通量染色體構象捕獲法hic或者近緣參考基因組法。
3.根據權利要求1所述基因組完成圖的基因組組裝方法,其特征在于:步驟2中將重疊群錨定在參考基因組的染色體上的方法:采用Nucmer或MCScan軟件將重疊群映射到參考基因組的染色體上,接著檢索映射在參考基因組的染色體上的共線塊的位置和方向;如果重疊群映射到多條參考基因組的染色體上,將映射到多條參考基因組的染色體上的重疊群分配給共線塊數最多參考基因組的染色體;然后根據重疊群在參考基因組的染色體上最長共線塊的位置和方向,對重疊群進行排序和定向。
4.根據權利要求2所述基因組完成圖的基因組組裝方法,其特征在于:步驟2中相鄰的重疊群以100個N連接。
5.根據權利要求2所述基因組完成圖的基因組組裝方法,其特征在于:步驟2中刪除小于300Kb的重疊群以提高錨定精度。
6.根據權利要求1所述基因組完成圖的基因組組裝方法,其特征在于:步驟4中尋找最短路徑的方法:對于每個缺口,以缺口的起點為中心構建自我圖,并在自我圖中找到從缺口的起點到終點的路徑;如果存在多個路徑,選擇重疊最多的最短路徑。
7.根據權利要求6所述基因組完成圖的基因組組裝方法,其特征在于:步驟4中尋找最短路徑時,如果未找到路徑,則刪除缺口上下游的唯一性可組裝片段,然后再次尋找最短路徑,最后,如果仍未找到最短路徑,在相應位置插入100個N。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于南京大學,未經南京大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110069693.X/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:制備活性焦的方法和活性焦及其應用
- 下一篇:一種選換擋機構性能測試設備





