[發明專利]一種基因序列數據處理方法、裝置及系統在審
| 申請號: | 201810296700.8 | 申請日: | 2018-04-03 |
| 公開(公告)號: | CN108537006A | 公開(公告)日: | 2018-09-14 |
| 發明(設計)人: | 朱紅 | 申請(專利權)人: | 鄭州云海信息技術有限公司 |
| 主分類號: | G06F19/20 | 分類號: | G06F19/20;G06F19/28 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 450018 河南省鄭州市*** | 國省代碼: | 河南;41 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基因序列 程序運行 數據處理 子結果 作業調度系統 裝置及系統 腳本 源代碼 參考基因序列 多節點計算機 數據處理結果 計算機集群 軟硬件環境 并行處理 基因數據 集群資源 腳本運行 修改軟件 因子序列 多節點 集群 適配 操作系統 申請 投遞 參考 輸出 | ||
1.一種基因序列數據處理方法,其特征在于,應用于多節點計算機集群,所述方法包括:
根據設定的拆分規則,對參考基因序列進行拆分,獲得M組參考基因子序列;
生成M個程序運行腳本,將所述M個程序運行腳本投遞到所述多節點計算機集群的作業調度系統中進行計算,獲得M個基因序列處理子結果,其中,每個程序運行腳本運行結束后輸出一個相應的基因序列處理子結果;
對所述M個基因序列處理子結果進行匯總,獲得基因序列數據處理結果。
2.根據權利要求1所述的方法,其特征在于,所述根據設定的拆分規則,對參考基因序列進行拆分,獲得M組參考基因子序列,包括:
根據所述參考基因序列內染色體的數量,對參考基因序列進行拆分,獲得M組參考基因子序列,其中,每組參考基因子序列對應一條染色體。
3.根據權利要求1所述的方法,其特征在于,所述根據設定的拆分規則,對參考基因序列進行拆分,獲得M組參考基因子序列,包括:
根據設定的分組數,對所述參考基因序列進行拆分,獲得M組參考基因子序列,其中,任意兩組參考基因子序列的長度差值小于或等于預設閾值。
4.根據權利要求1-3任一項所述的方法,其特征在于,定義允許同時運行的程序運行腳本的最大數量N;
若所述N<M,所述將所述M個程序運行腳本投遞到所述多節點計算機集群的作業調度系統中進行計算,包括:
將所述M個程序運行腳本中的N個程序運行腳本投遞到所述多節點計算機集群的作業調度系統中進行計算;
監控所述N個程序運行腳本中每個程序運行腳本的運行狀態;
若存在一個程序運行腳本運行結束,則將未運行的程序運行腳本中的一個程序運行腳本投遞到所述多節點計算機集群的作業調度系統中進行計算。
5.根據權利要求1所述的方法,其特征在于,所述程序運行腳本表征的數據處理過程包括:
將測序基因序列與相應的參考基因子序列進行對比,獲得對比結果;
對所述對比結果進行分析,獲得基因序列處理子結果。
6.一種基因序列數據處理裝置,其特征在于,應用于多節點計算機集群,所述裝置包括:
數據拆分模塊,用于根據設定的拆分規則,對參考基因序列進行拆分,獲得M組參考基因子序列;
集群調度模塊,用于生成M個程序運行腳本,將所述M個程序運行腳本投遞到所述多節點計算機集群的作業調度系統中進行計算,獲得M個基因序列處理子結果,其中,每個程序運行腳本運行結束后輸出一個相應的基因序列處理子結果;
匯總模塊,用于對所述M個基因序列處理子結果進行匯總,獲得基因序列數據處理結果。
7.根據權利要求6所述的裝置,其特征在于,所述數據拆分模塊,具體用于:
根據所述參考基因序列內染色體的數量,對參考基因序列進行拆分,獲得M組參考基因子序列,其中,每組參考基因子序列對應一條染色體。
8.根據權利要求6所述的裝置,其特征在于,所述數據拆分模塊,具體用于:
根據設定的分組數,對所述參考基因序列進行拆分,獲得M組參考基因子序列,其中,任意兩組參考基因子序列的長度差值小于或等于預設閾值。
9.根據權利要求6-8任一項所述的裝置,其特征在于,定義允許同時運行的程序運行腳本的最大數量N;
所述集群調度模塊,具體用于:
若所述N<M,將所述M個程序運行腳本中的N個程序運行腳本投遞到所述多節點計算機集群的作業調度系統中進行計算;
監控所述N個程序運行腳本中每個程序運行腳本的運行狀態;
若存在一個程序運行腳本運行結束,則將未運行的程序運行腳本中的一個程序運行腳本投遞到所述多節點計算機集群的作業調度系統中進行計算。
10.一種基因序列數據處理系統,其特征在于,包括多節點計算機集群,所述多節點計算機集群上部署用于執行權利要求1-5任一項所述的方法的軟件。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于鄭州云海信息技術有限公司,未經鄭州云海信息技術有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201810296700.8/1.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





