[發明專利]基因組組裝方法、裝置、設備及存儲介質有效
| 申請號: | 202210311761.3 | 申請日: | 2022-03-28 |
| 公開(公告)號: | CN114694755B | 公開(公告)日: | 2023-01-24 |
| 發明(設計)人: | 王瑩;盧宇彤;陳志廣 | 申請(專利權)人: | 中山大學 |
| 主分類號: | G16B30/20 | 分類號: | G16B30/20;G16B20/00 |
| 代理公司: | 深圳市世紀恒程知識產權代理事務所 44287 | 代理人: | 薛福玲 |
| 地址: | 510275 *** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基因組 組裝 方法 裝置 設備 存儲 介質 | ||
1.一種基因組組裝方法,其特征在于,所述基因組組裝方法包括:
獲取基因短序列,以及確定第一分割值;
基于所述第一分割值,將所述基因短序列進行分割,得到各基因子序列;
基于預設分組并行正則采樣排序算法,對各所述基因子序列進行全局排序,得到各排序基因子序列,其中,所述預設分組并行正則采樣排序算法為基于預先分組后的各個進程并行對各所述基因子序列進行正則采樣排序的算法;
基于各所述排序基因子序列,構建分布式基因圖;
并行遍歷所述分布式基因圖,得到各連續基因序列,并對各所述連續基因序列進行填充組裝,得到各目標連續基因序列;
確定第二分割值,若所述第二分割值大于或等于預設最大分割閾值,則將各所述目標連續基因序列進行組裝,得到基因組組裝結果;
其中,在所述確定第二分割值的步驟之后,所述基因組組裝方法還包括:
若所述第二分割值小于所述預設最大分割閾值,則基于所述第二分割值,在所述目標連續基因序列提取各分割序列,并返回執行步驟:基于所述第二分割值,將所述基因短序列進行分割,得到各基因子序列,直至得到各個新的排序基因子序列;
將各所述分割序列和各所述新的排序基因子序列進行合并,得到各合并基因序列;
基于各所述合并基因序列,返回執行步驟:構建分布式基因圖,以得到新的目標連續基因序列,直至確定的分割值大于所述預設最大分割閾值,將各所述新的目標連續基因序列進行組裝,得到基因組組裝結果。
2.如權利要求1所述的基因組組裝方法,其特征在于,所述基于所述第一分割值,將所述基因短序列進行分割,得到各基因子序列的步驟包括:
將所述第一分割值加上預設最大分割閾值,得到分割窗口;
基于所述分割窗口,對所述基因短序列進行掃描分割,得到各所述基因子序列,其中,每一所述基因子序列的長度為分割窗口的長度。
3.如權利要求2所述的基因組組裝方法,其特征在于,所述基于預設分組并行正則采樣排序算法,將各所述基因子序列進行全局排序,得到各排序基因子序列的步驟包括:
分別對各所述基因子序列中前綴長度為所述第一分割值對應的前綴序列進行反轉后按照字母表順序進行排序,并基于排序結果,對各所述基因子序列進行排序,得到各初始排序序列;
獲取進程的數量,并基于所述數量,將各所述進程進行分組,得到各進程組,其中,每一所述進程組中的各進程設置有對應的編號;
將每一所述初始排序序列作為一個待排序元素,并將各所述待排序元素分配至各所述進程中;
通過每一進程組中的各進程并行對各所述待排序元素進行正則采樣排序,得到各排序基因子序列。
4.如權利要求3所述的基因組組裝方法,其特征在于,所述通過每一進程組中的各進程并行對各所述待排序元素進行正則采樣排序,得到各排序基因子序列的步驟包括:
針對每一所述進程中的各待排序元素,將各所述待排序元素進行排序,得到第一排序元素,并對所述第一排序元素進行正則采樣,得到第一采樣元素;
將各所述進程中的第一采樣元素發送至對應進程組的第一編號進程,并針對每一進程組中的第一編號進程,并行對各所述第一采樣元素進行排序以及正則采樣,得到各所述進程組的組采樣元素;
將各所述組采樣元素發送至預設全局進程,并通過所述預設全局進程對各所述組采樣元進行排序以及正則采樣,得到全局采樣元素;
基于所述全局采樣元素,分別將各所述進程中的第一排序元素進行劃分,得到各劃分元素,并記錄各所述劃分元素對應的元素數量和位移;
將不同進程組之間編號相同的各進程組成一個新的通信子域;
針對每一所述通信子域中的各進程,基于各所述進程中各劃分元素對應的元素數量和位移,將各個進程中的各劃分元素進行數據交換,得到各所述進程中的目標元素;
將各個進程中的目標元素進行歸并排序,得到第二排序元素;
并行將每一所述通信子域中各進程的第二排序元素進行正則采樣排序,得到各所述排序基因子序列。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中山大學,未經中山大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202210311761.3/1.html,轉載請聲明來源鉆瓜專利網。





