[發(fā)明專利]超長基因序列的相似性快速比對方法及系統(tǒng)在審
申請?zhí)枺?/td> | 202010218462.6 | 申請日: | 2020-03-25 |
公開(公告)號: | CN111445952A | 公開(公告)日: | 2020-07-24 |
發(fā)明(設計)人: | 劉衛(wèi)國;秦梓恒;殷澤坤;徐曉明;劉美洋 | 申請(專利權)人: | 山東大學 |
主分類號: | G16B30/10 | 分類號: | G16B30/10;G16B40/00;G16B50/00 |
代理公司: | 濟南圣達知識產(chǎn)權代理有限公司 37221 | 代理人: | 黃海麗 |
地址: | 250101 *** | 國省代碼: | 山東;37 |
權利要求書: | 查看更多 | 說明書: | 查看更多 |
摘要: | |||
搜索關鍵詞: | 超長 基因 序列 相似性 速比 方法 系統(tǒng) | ||
本公開公開了超長基因序列的相似性快速比對方法及系統(tǒng),獲取超長參考基因序列;對超長參考基因序列構建增強型系數(shù)后綴數(shù)組ESSA;獲取超長待查詢基因序列;對超長待查詢基因序列構建增強型系數(shù)后綴數(shù)組ESSA;將超長參考基因序列的增強型系數(shù)后綴數(shù)組ESSA,與超長待查詢基因序列的增強型系數(shù)后綴數(shù)組ESSA進行匹配,匹配出重疊部分MEM;對二者的重疊部分MEM進行去冗余處理,得到最大唯一匹配部分MUM;對超長參考基因序列的MUM和超長待查詢基因序列的最大唯一匹配部分MUM進行相似度計算,將相似度大于設定閾值的超長參考基因序列對應的基因類型作為超長待查詢基因序列對應的基因類型。
技術領域
本公開涉及基因相似性比對技術領域,特別是涉及超長基因序列的相似性快速比對方法及系統(tǒng)。
背景技術
本部分的陳述僅僅是提到了與本公開相關的背景技術,并不必然構成現(xiàn)有技術。
在生物信息學領域,隨著高通量測序技術的發(fā)展,當前得到的大規(guī)模數(shù)據(jù)集往往會超出許多現(xiàn)有軟件對于輸入序列的最大長度限制,并且對于大規(guī)模范圍的數(shù)據(jù)現(xiàn)有方法往往需要更長的處理時間。
在實現(xiàn)本公開的過程中,發(fā)明人發(fā)現(xiàn)現(xiàn)有技術中存在以下技術問題:
現(xiàn)有方法的單線程處理能力、對輸入序列長度大小的約束,限制了序列比對的效率。
發(fā)明內(nèi)容
為了解決現(xiàn)有技術的不足,本公開提供了超長基因序列的相似性快速比對方法及系統(tǒng);
第一方面,本公開提供了超長基因序列的相似性快速比對方法;
超長基因序列的相似性快速比對方法,包括:
獲取超長參考基因序列;對超長參考基因序列構建增強型系數(shù)后綴數(shù)組ESSA;
獲取超長待查詢基因序列;對超長待查詢基因序列構建增強型系數(shù)后綴數(shù)組ESSA;
將超長參考基因序列的增強型系數(shù)后綴數(shù)組ESSA,與超長待查詢基因序列的增強型系數(shù)后綴數(shù)組ESSA進行匹配,匹配出重疊部分MEM;
對二者的重疊部分MEM進行去冗余處理,得到最大唯一匹配部分MUM;
對超長參考基因序列的MUM和超長待查詢基因序列的最大唯一匹配部分MUM進行相似度計算,將相似度大于設定閾值的超長參考基因序列對應的基因類型作為超長待查詢基因序列對應的基因類型。
第二方面,本公開還提供了超長基因序列的相似性快速比對系統(tǒng);
超長基因序列的相似性快速比對系統(tǒng),包括:
第一獲取模塊,其被配置為:獲取超長參考基因序列;對超長參考基因序列構建增強型系數(shù)后綴數(shù)組ESSA;
第二獲取模塊,其被配置為:獲取超長待查詢基因序列;對超長待查詢基因序列構建增強型系數(shù)后綴數(shù)組ESSA;
匹配模塊,其被配置為:將超長參考基因序列的增強型系數(shù)后綴數(shù)組ESSA,與超長待查詢基因序列的增強型系數(shù)后綴數(shù)組ESSA進行匹配,匹配出重疊部分MEM;
去冗余模塊,其被配置為:對二者的重疊部分MEM進行去冗余處理,得到最大唯一匹配部分MUM;
分類模塊,其被配置為:對超長參考基因序列的MUM和超長待查詢基因序列的最大唯一匹配部分MUM進行相似度計算,將相似度大于設定閾值的超長參考基因序列對應的基因類型作為超長待查詢基因序列對應的基因類型。
第三方面,本公開還提供了一種電子設備,包括存儲器和處理器以及存儲在存儲器上并在處理器上運行的計算機指令,所述計算機指令被處理器運行時,完成第一方面所述方法的步驟。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東大學,未經(jīng)山東大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010218462.6/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。