[發(fā)明專利]一種基于容器技術(shù)的生物信息分析計算系統(tǒng)及方法在審
| 申請?zhí)枺?/td> | 202110484623.0 | 申請日: | 2021-04-30 |
| 公開(公告)號: | CN113326123A | 公開(公告)日: | 2021-08-31 |
| 發(fā)明(設(shè)計)人: | 余育超;朱曉文 | 申請(專利權(quán))人: | 杭州繩武科技有限公司 |
| 主分類號: | G06F9/50 | 分類號: | G06F9/50 |
| 代理公司: | 杭州華知專利事務(wù)所(普通合伙) 33235 | 代理人: | 束曉前 |
| 地址: | 311121 浙江省杭州市余*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 容器 技術(shù) 生物 信息 分析 計算 系統(tǒng) 方法 | ||
本發(fā)明涉及一種基于容器技術(shù)的生物信息分析計算系統(tǒng)及方法,包括:Web交互模塊:用戶輸入需要進(jìn)行生物信息分析的原始數(shù)據(jù)以及提交分析任務(wù);管理模塊:用于在管控節(jié)點發(fā)出調(diào)配指令,創(chuàng)建用于進(jìn)行分析計算的分析計算容器;計算模塊:包括若干分析計算容器,用于根據(jù)用戶輸入的原始數(shù)據(jù)以及分析任務(wù)的內(nèi)容進(jìn)行分析計算,得出分析結(jié)果;存儲模塊:用于存儲用戶輸入的原始數(shù)據(jù)以及計算模塊得出的分析結(jié)果;數(shù)據(jù)交付平臺:用于將分析結(jié)果形成報告交付給用戶。本發(fā)明能夠進(jìn)一步提升基因數(shù)據(jù)分析計算的工業(yè)化標(biāo)準(zhǔn)化進(jìn)程,以流水線式的模式分析,降低CPU、內(nèi)存、存儲、網(wǎng)絡(luò)等資源資源的空閑成本,提升了效率。
技術(shù)領(lǐng)域
本發(fā)明屬于生物信息分析技術(shù)領(lǐng)域,具體涉及一種基于容器技術(shù)的生物信息分析計算系統(tǒng)及方法。
背景技術(shù)
生物信息分析計算主要指處理當(dāng)今生物檢測技術(shù)產(chǎn)生的大量原始生物數(shù)據(jù)(包括基因數(shù)據(jù)、蛋白數(shù)據(jù)等)。計算這些大數(shù)據(jù)需要使用專業(yè)的服務(wù)器進(jìn)行計算,現(xiàn)有的計算技術(shù)方案主要是以下兩種:
(1)本地架設(shè)服務(wù)器進(jìn)行生物信息數(shù)據(jù)分析計算。 根據(jù)計算數(shù)據(jù)需求的不同,采購各種類型的服務(wù)器來搭建本地的計算平臺。例如塔式服務(wù)器、機架式服務(wù)器等。這種技術(shù)方案存在單次投入成本高、可擴(kuò)展性差、日常維護(hù)成本高、回本時間長等問題。
(2)購買云服務(wù)商提供的云服務(wù)器ECS、批量計算、高性能計算服務(wù)來進(jìn)行生物信息數(shù)據(jù)計算。這種技術(shù)方案因為受行業(yè)整體發(fā)展領(lǐng)域比較前沿的制約,云服務(wù)商提供的這些服務(wù)存在行業(yè)適配度低,云計算資源浪費造成成本無較大優(yōu)勢的問題。
以上兩種分析計算的生產(chǎn)模式是一種小作坊式的分析計算模式,更大的生產(chǎn)投入是建造更大的作坊。隨著基因數(shù)據(jù)的爆發(fā)式增長,產(chǎn)能限制瓶頸會愈發(fā)突出。
且生物信息學(xué)分析包含的種類比較繁多,涉及到的分析軟件多,開發(fā)語言也多(包括Perl、python、Java、R等)。故以往的技術(shù)方案是在服務(wù)器上安裝盡可能多的操作系統(tǒng),軟件來滿足分析需求。服務(wù)器的系統(tǒng)軟件配置就比較復(fù)雜且不易于管理。
基因數(shù)據(jù)分析任務(wù)發(fā)生時,不同軟件的開發(fā)邏輯不同,對服務(wù)器的CPU和內(nèi)存要求都有不同需求。服務(wù)器的CPU和內(nèi)存配比很難做到適應(yīng)所有的需求。現(xiàn)有技術(shù)中是本地配置高性能的服務(wù)器,或者云端購買高性能的云服務(wù)器。在分析計算時,會造成大量的CPU浪費或者內(nèi)存空閑,分析計算費用高居不下。
發(fā)明內(nèi)容
為了解決上述問題,本發(fā)明提供了一種基于容器技術(shù)的生物信息分析計算系統(tǒng)及方法,能夠進(jìn)一步提升基因數(shù)據(jù)計算的工業(yè)化標(biāo)準(zhǔn)化進(jìn)程,以流水線式的模式分析,降低CPU、內(nèi)存、存儲、網(wǎng)絡(luò)等資源資源的空閑成本,提升了效率。
本發(fā)明的技術(shù)方案如下所示:
一種基于容器技術(shù)的生物信息分析計算系統(tǒng),包括:
Web交互模塊:用戶輸入需要進(jìn)行生物信息分析的原始數(shù)據(jù)以及提交分析任務(wù);
調(diào)控模塊:根據(jù)用戶提交的任務(wù)信息,拆分成各個類型的分析子任務(wù),并創(chuàng)建用于分析計算的節(jié)點容器,實時監(jiān)控處理各個任務(wù)數(shù)據(jù)狀態(tài),并對任務(wù)狀態(tài)進(jìn)行實時更新反饋;
計算分析模塊:包括各種類型的生物信息分析計算容器,管理系統(tǒng)根據(jù)不同的分析子任務(wù)選擇對應(yīng)的容器,快速的部署用于分析計算的節(jié)點容器;
數(shù)據(jù)共享模塊:用于保存各個任務(wù)節(jié)點容器運行所生成的數(shù)據(jù);通過數(shù)據(jù)共享的模式,減少各個節(jié)點容器之間的數(shù)據(jù)傳輸,可以有效的降低任務(wù)執(zhí)行時間,提升效率;
數(shù)據(jù)存儲模塊:用于存儲用戶輸入的原始數(shù)據(jù)以及分析結(jié)果數(shù)據(jù);
數(shù)據(jù)交付平臺:用于將分析結(jié)果形成報告交付給用戶。
優(yōu)選的,所述分析計算容器利用docker技術(shù)根據(jù)不同的分析步驟時需求的系統(tǒng)環(huán)境和運行使用的軟件不同,進(jìn)行特異性的鏡像構(gòu)建封裝,再根據(jù)封裝后鏡像的各種軟件以及數(shù)據(jù)分析需求,配套相應(yīng)的計算資源進(jìn)行創(chuàng)建。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于杭州繩武科技有限公司,未經(jīng)杭州繩武科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110484623.0/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。





