[發(fā)明專利]基于計(jì)算云平臺(tái)的微生物多樣性交互分析系統(tǒng)及其方法在審
| 申請(qǐng)?zhí)枺?/td> | 201710598335.1 | 申請(qǐng)日: | 2017-07-21 |
| 公開(公告)號(hào): | CN107368700A | 公開(公告)日: | 2017-11-21 |
| 發(fā)明(設(shè)計(jì))人: | 余果;任一;郭權(quán);王兆月;董亞晨;劉林夢(mèng);趙建華;楊慧;宣紅東 | 申請(qǐng)(專利權(quán))人: | 上海桑格信息技術(shù)有限公司 |
| 主分類號(hào): | G06F19/10 | 分類號(hào): | G06F19/10;G06F19/26 |
| 代理公司: | 上海恒銳佳知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙)31286 | 代理人: | 黃海霞 |
| 地址: | 201321 上海市浦*** | 國省代碼: | 上海;31 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 基于 計(jì)算 平臺(tái) 微生物 多樣性 交互 分析 系統(tǒng) 及其 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及生物信息分析技術(shù)領(lǐng)域,尤其涉及一種基于計(jì)算云平臺(tái)的微生物多樣性交互分析系統(tǒng)及其方法。
背景技術(shù)
微生物作為生物類群的重要組成部分,具有巨大的種群數(shù)量,廣泛的分布范圍,極強(qiáng)的適應(yīng)與繁殖能力。一些非培養(yǎng)的研究微生物多樣性的方法,如DNA指紋圖譜技術(shù)、微陣列基因芯片等,克服了傳統(tǒng)培養(yǎng)技術(shù)的一些缺點(diǎn),獲得了一部分不能分離培養(yǎng)的土壤微生物信息。高通量測序方法實(shí)現(xiàn)了大規(guī)模微生物基因直接測序,極大的提高了測序通量,在微生物物種和結(jié)構(gòu)多樣性研究中可獲得更多的信息。
生物信息學(xué)數(shù)據(jù)分析是高通量測序應(yīng)用于微生物多樣性研究的最關(guān)鍵步驟。Illumina HiSeq運(yùn)行一次產(chǎn)生的數(shù)據(jù)量高達(dá)1000G,個(gè)人計(jì)算機(jī)和工作站顯然無法完成這些數(shù)據(jù)的處理工作。
高通量數(shù)據(jù)處理時(shí)要對(duì)數(shù)據(jù)進(jìn)行調(diào)整、篩選、比對(duì),需要生物信息學(xué)工作者掌握腳本程序編寫能力。現(xiàn)有微生物多樣性生物信息分析主要由三部分組成。標(biāo)準(zhǔn)生物信息學(xué)分析是整個(gè)多樣性分析的基礎(chǔ),其結(jié)果呈現(xiàn)包括有效測序序列結(jié)果統(tǒng)計(jì)、優(yōu)質(zhì)序列統(tǒng)計(jì)、各樣本序列數(shù)目統(tǒng)計(jì)、OTU(操作分類單元)生成、稀釋曲線分析、多樣性指數(shù)分析、樣品OTU分布及分類學(xué)信息。高級(jí)生物信息學(xué)分析呈現(xiàn)方式包括:聚類分析、多樣品群落結(jié)構(gòu)分析以及組間顯著性差異分析等。個(gè)性化生物信息學(xué)分析包括:PCA分析、RDA/CCA分析等。
現(xiàn)有技術(shù)的業(yè)務(wù)流程采用手動(dòng)的方式,工作效率較低,因此無法滿足市場的需求。
發(fā)明內(nèi)容
針對(duì)上述技術(shù)中存在的不足之處,本發(fā)明提供一種基于計(jì)算云平臺(tái)的微生物多樣性交互分析系統(tǒng)及其方法,以解決個(gè)人計(jì)算機(jī)和工作站無法完成數(shù)據(jù)處理和現(xiàn)有手動(dòng)業(yè)務(wù)流程效率低的問題。
為實(shí)現(xiàn)上述目的,本發(fā)明提供一種基于計(jì)算云平臺(tái)的微生物多樣性交互分析系統(tǒng),包括
項(xiàng)目管理模塊,用于對(duì)項(xiàng)目信息進(jìn)行查看和管理,通過項(xiàng)目、任務(wù)、應(yīng)用和文件對(duì)所有狀態(tài)的分析項(xiàng)目進(jìn)行綜合管理;
基礎(chǔ)分析任務(wù)提交模塊,用于設(shè)置基礎(chǔ)參數(shù)運(yùn)行任務(wù),并將結(jié)果以及原始數(shù)據(jù)按照預(yù)設(shè)格式整合封裝成相應(yīng)的項(xiàng)目文件;
交互式結(jié)果分析模塊,用于根據(jù)用戶請(qǐng)求生成分析結(jié)果,并將結(jié)果可視化展示;
所述項(xiàng)目管理模塊通過基礎(chǔ)分析任務(wù)提交模塊與交互式結(jié)果分析模塊相連接;
首先,向本地集群服務(wù)器上傳測序數(shù)據(jù),在項(xiàng)目管理模塊中建立項(xiàng)目,同時(shí)在本地集群服務(wù)器上傳客戶的數(shù)據(jù)庫或者選擇使用線上的數(shù)據(jù)庫,并且在該項(xiàng)目管理模塊中可以進(jìn)行項(xiàng)目鎖定或者共享給他人操作;
然后,在基礎(chǔ)分析任務(wù)提交模塊中,用戶可以通過可視化界面對(duì)測序數(shù)據(jù)進(jìn)行參數(shù)分析,分析之后產(chǎn)生項(xiàng)目文件;分析之前,先進(jìn)行判定數(shù)據(jù)質(zhì)控是否合格,若合格則進(jìn)行參數(shù)分析;若不合格則直接返回報(bào)錯(cuò);
最后,產(chǎn)生的項(xiàng)目文件傳送至交互式結(jié)果分析模塊中進(jìn)行交互式分析,根據(jù)用戶需求對(duì)項(xiàng)目文件進(jìn)行二次分析和統(tǒng)計(jì),得到直觀呈現(xiàn)的報(bào)告。
為實(shí)現(xiàn)上述目的,本發(fā)明還提供一種基于計(jì)算云平臺(tái)的微生物多樣性交互分析方法,包括以下步驟:
步驟0,創(chuàng)建項(xiàng)目;
步驟1,向本地集群服務(wù)器上傳測序數(shù)據(jù),在項(xiàng)目管理模塊中建立項(xiàng)目,同時(shí)在本地集群服務(wù)器上傳客戶的數(shù)據(jù)庫或者選擇使用線上的數(shù)據(jù)庫,并且在該項(xiàng)目管理模塊中可以進(jìn)行項(xiàng)目鎖定或者共享給他人操作;
步驟2,建立任務(wù);
步驟3,在基礎(chǔ)分析任務(wù)提交模塊中,用戶可以通過可視化界面對(duì)測序數(shù)據(jù)進(jìn)行參數(shù)分析,分析之后產(chǎn)生項(xiàng)目文件;分析之前,先進(jìn)行判定數(shù)據(jù)質(zhì)控是否合格,若合格則進(jìn)行參數(shù)分析;若不合格則直接返回報(bào)錯(cuò);
步驟4,產(chǎn)生的項(xiàng)目文件傳送至交互式結(jié)果分析模塊中進(jìn)行交互式分析,根據(jù)用戶需求對(duì)項(xiàng)目文件進(jìn)行二次分析和統(tǒng)計(jì),得到直觀呈現(xiàn)的報(bào)告。
其中,所述步驟3中在進(jìn)行測序數(shù)據(jù)參數(shù)分析時(shí),用戶可以自行選擇分組方案,并且配置環(huán)境因子,選擇需要的數(shù)據(jù)庫,選擇完成之后再進(jìn)行分析。
其中,所述項(xiàng)目管理模塊,還可用于查看和管理上傳的相關(guān)文件或由分析產(chǎn)生的相關(guān)文件,可對(duì)相關(guān)文件進(jìn)行上傳、查找、復(fù)制、移動(dòng)、刪除和下載操作;項(xiàng)目管理模塊還用于標(biāo)記項(xiàng)目狀態(tài)進(jìn)度,項(xiàng)目狀態(tài)進(jìn)度可為未開始、進(jìn)行中、已完成、已終止和問題;項(xiàng)目管理模塊還用于查看任務(wù)運(yùn)行的狀態(tài)與日志信息;且項(xiàng)目管理模塊,還用于共享項(xiàng)目,并管理成員權(quán)限。
其中,物種分類數(shù)據(jù)庫存儲(chǔ)在本地集群服務(wù)器內(nèi),使用線上的數(shù)據(jù)庫包括16s、18s、its和fungi,也可上傳自定義數(shù)據(jù)庫。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于上海桑格信息技術(shù)有限公司,未經(jīng)上海桑格信息技術(shù)有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710598335.1/2.html,轉(zhuǎn)載請(qǐng)聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F19-00 專門適用于特定應(yīng)用的數(shù)字計(jì)算或數(shù)據(jù)處理的設(shè)備或方法
G06F19-10 .生物信息學(xué),即計(jì)算分子生物學(xué)中的遺傳或蛋白質(zhì)相關(guān)的數(shù)據(jù)處理方法或系統(tǒng)
G06F19-12 ..用于系統(tǒng)生物學(xué)的建模或仿真,例如:概率模型或動(dòng)態(tài)模型,遺傳基因管理網(wǎng)絡(luò),蛋白質(zhì)交互作用網(wǎng)絡(luò)或新陳代謝作用網(wǎng)絡(luò)
G06F19-14 ..用于發(fā)展或進(jìn)化的,例如:進(jìn)化的保存區(qū)域決定或進(jìn)化樹結(jié)構(gòu)
G06F19-16 ..用于分子結(jié)構(gòu)的,例如:結(jié)構(gòu)排序,結(jié)構(gòu)或功能關(guān)系,蛋白質(zhì)折疊,結(jié)構(gòu)域拓?fù)洌媒Y(jié)構(gòu)數(shù)據(jù)的藥靶,涉及二維或三維結(jié)構(gòu)的
G06F19-18 ..用于功能性基因組學(xué)或蛋白質(zhì)組學(xué)的,例如:基因型–表型關(guān)聯(lián),不均衡連接,種群遺傳學(xué),結(jié)合位置鑒定,變異發(fā)生,基因型或染色體組的注釋,蛋白質(zhì)相互作用或蛋白質(zhì)核酸的相互作用





