[發明專利]一種基因測序方法和裝置在審
| 申請號: | 202110353942.8 | 申請日: | 2021-04-01 |
| 公開(公告)號: | CN112992270A | 公開(公告)日: | 2021-06-18 |
| 發明(設計)人: | 崔坤磊 | 申請(專利權)人: | 山東英信計算機技術有限公司 |
| 主分類號: | G16B30/00 | 分類號: | G16B30/00;G16B50/30 |
| 代理公司: | 北京連和連知識產權代理有限公司 11278 | 代理人: | 劉小峰;陳黎明 |
| 地址: | 250101 山東省濟南市高新區*** | 國省代碼: | 山東;37 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基因 方法 裝置 | ||
本發明公開了一種基因測序方法和裝置,方法包括:基于參數文件創建項目目錄樹并生成具有多個分析任務作業的作業流;在作業流中依次調用每個分析任務來處理基因測序數據;響應于有分析任務在處理基因測序數據時請求調用應用軟件,而從應用軟件平臺調用應用軟件;響應于有分析任務或應用軟件在處理基因測序數據時請求調用測序參考數據,而從數據庫系統調用測序參考數據;響應于有分析任務完成并輸出臨時結果,而將臨時結果輸入作業流中的下一個分析任務以繼續處理基因測序數據直到獲得基因測序結果。本發明能夠高效地執行基因測序流程,并兼容斷點處理,降低中斷成本。
技術領域
本發明涉及基因測序領域,更具體地,特別是指一種基因測序方法和裝置。
背景技術
新一代測序的發展和推廣應用使生物序列數據增長速度遠遠超過了摩爾定律對計算機處理能力增長的預期。研究人員將深入分析各種基因組數據的特點,針對性地研究高效數據壓縮和傳輸的方法,研究新型的數據存儲系統構架;研究在壓縮空間上進行數據處理的方法,將存儲、壓縮和處理、應用結合起來考慮,發展適應超大規?;蚪M數據的搜索方法;深入分析測序數據的特點和測序數據常見處理任務對計算資源的需求特點,探索新的軟硬件模型和可能的新型體系結構,探索新的計算服務模型在測序數據存儲、傳輸和處理上的應用,從計算技術上為迎接個體基因時代的到來做好充分準備。
至今,受益于軟件技術的繁榮創新,生物信息學數據的處理已經形成了系統化、流程化的數據處理方法。所謂流程,即針對測序下機數據的一系列處理作業,且這些作業是存在先后順序和依賴關系的,上一個作業的輸出結果為下一個作業的輸入數據,各作業由不同應用軟件完成。因此,如何高效地執行創建流程、高效執行流程中的作業,避免作業之間的銜接的時間和資源浪費,就成為測序數據處理流程中必須要考慮的問題。同時,當流程中有作業出錯時,還必須能夠快速定位出錯的作業,并從該出錯作業開始斷點執行流程。
針對現有技術中測序數據處理流程缺乏高效的創建和執行、難以定位錯誤并斷點執行的問題,目前尚無有效的解決方案。
發明內容
有鑒于此,本發明實施例的目的在于提出一種基因測序方法和裝置,能夠高效地執行基因測序流程,并兼容斷點處理,降低中斷成本。
基于上述目的,本發明實施例的第一方面提供了一種基因測序方法,包括執行以下步驟:
基于參數文件創建項目目錄樹并在項目目錄樹中生成具有多個分析任務作業的作業流;
獲取基因測序數據,并基于參數文件在作業流中依次調用每個分析任務來處理基因測序數據;
響應于有分析任務在處理基因測序數據時請求調用應用軟件,而允許分析任務基于參數文件從應用軟件平臺調用應用軟件以處理基因測序數據;
響應于有分析任務或應用軟件在處理基因測序數據時請求調用測序參考數據,而允許分析任務或應用軟件基于參數文件從數據庫系統調用測序參考數據以處理基因測序數據;
響應于有分析任務完成并輸出臨時結果,而將臨時結果輸入作業流中的下一個分析任務以繼續處理基因測序數據直到獲得基因測序結果。
在一些實施方式中,方法還包括:
響應于有分析任務在處理基因測序數據時發生中斷,而獲取在中斷時生成的任務狀態信息和錯誤信息;
響應于接收到使發生報錯中斷的作業流繼續執行的指示,而基于任務狀態信息和錯誤信息在中斷位置重新執行分析任務。
在一些實施方式中,參數文件包括工程名、工程類型、和工程主目錄;基于參數文件創建項目目錄樹包括:基于工程名、工程類型、和工程主目錄創建項目目錄樹。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于山東英信計算機技術有限公司,未經山東英信計算機技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110353942.8/2.html,轉載請聲明來源鉆瓜專利網。





