[發明專利]一種建立基因比對表的方法、系統、設備及介質有效
| 申請號: | 202010174947.X | 申請日: | 2020-03-13 |
| 公開(公告)號: | CN111402958B | 公開(公告)日: | 2022-05-17 |
| 發明(設計)人: | 葛沅;史宏志;尹云峰;崔星辰 | 申請(專利權)人: | 蘇州浪潮智能科技有限公司 |
| 主分類號: | G16B30/10 | 分類號: | G16B30/10;G16B50/00;G06F16/22 |
| 代理公司: | 北京連和連知識產權代理有限公司 11278 | 代理人: | 張濤 |
| 地址: | 215100 江蘇省蘇州市吳*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 建立 基因 方法 系統 設備 介質 | ||
1.一種建立基因比對表的方法,其特征在于,包括以下步驟:
從參考基因組序列中讀取連續第一長度的子序列作為種子,并確定所述種子對應的最長讀取長度;
將多個所述種子依次存放到緩存區,將第一個種子作為待選種子,并判斷所述緩存區中種子的數量是否達到閾值;
響應于所述緩存區中種子的數量未達到閾值,判斷向緩存區存放的當前種子對應的最長讀取長度是否大于所述第一長度和所述閾值的和;
響應于所述當前種子對應的最長讀取長度大于所述第一長度和所述閾值的和,判斷所述當前種子的哈希值是否小于待選種子的哈希值;以及
響應于所述當前種子的哈希值小于待選種子的哈希值,將所述當前種子寫入基因比對表,并將所述當前種子更新為待選種子,
所述方法還包括:響應于所述緩存區中種子的數量達到閾值,把所述待選種子寫入所述基因比對表,并在所述緩存區中確定哈希值最小的種子作為待選種子。
2.根據權利要求1所述的方法,其特征在于,還包括:
響應于所述當前種子對應的最長讀取長度等于所述第一長度和所述閾值的和,判斷所述當前種子的哈希值與所述待選種子的哈希值是否相同。
3.根據權利要求2所述的方法,其特征在于,還包括:
響應于所述當前種子的哈希值與所述待選種子的哈希值相同,判斷所述當前種子和所述待選種子在所述參考基因組的標識是否相同。
4.一種建立基因比對表的系統,其特征在于,包括:
讀取模塊,配置用于從參考基因組序列中讀取連續第一長度的子序列作為種子,并確定所述種子對應的最長讀取長度;
第一判斷模塊,配置用于將多個所述種子依次存放到緩存區,將第一個種子作為待選種子,并判斷所述緩存區中種子的數量是否達到閾值;
第二判斷模塊,配置用于響應于所述緩存區中種子的數量未達到閾值,判斷向緩存區存放的當前種子對應的最長讀取長度是否大于所述第一長度和所述閾值的和;
第三判斷模塊,配置用于響應于所述當前種子對應的最長讀取長度大于所述第一長度和所述閾值的和,判斷所述當前種子的哈希值是否小于待選種子的哈希值;以及
執行模塊,配置用于響應于所述當前種子的哈希值小于待選種子的哈希值,將所述當前種子寫入基因比對表,并將所述當前種子更新為待選種子,
系統還包括:第二執行模塊,配置用于響應于所述緩存區中種子的數量達到閾值,把所述待選種子寫入所述基因比對表,并在所述緩存區中確定哈希值最小的種子作為待選種子。
5.根據權利要求4所述的系統,其特征在于,還包括:
第四判斷模塊,配置用于響應于所述當前種子對應的最長讀取長度等于所述第一長度和所述閾值的和,判斷所述當前種子的哈希值與所述待選種子的哈希值是否相同。
6.根據權利要求5所述的系統,其特征在于,還包括:
第五判斷模塊,配置用于響應于所述當前種子的哈希值與所述待選種子的哈希值相同,判斷所述當前種子和所述待選種子在所述參考基因組的標識是否相同。
7.一種計算機設備,其特征在于,包括:
至少一個處理器;以及
存儲器,所述存儲器存儲有可在所述處理器上運行的計算機指令,所述指令由所述處理器執行時實現權利要求1-3任意一項所述方法的步驟。
8.一種計算機可讀存儲介質,所述計算機可讀存儲介質存儲有計算機程序,其特征在于,所述計算機程序被處理器執行時實現權利要求1-3任意一項所述方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于蘇州浪潮智能科技有限公司,未經蘇州浪潮智能科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010174947.X/1.html,轉載請聲明來源鉆瓜專利網。





