[發明專利]一種基于OrthoMCL聚類結果的快速分析方法有效
| 申請號: | 201911044264.6 | 申請日: | 2019-10-30 |
| 公開(公告)號: | CN110808085B | 公開(公告)日: | 2023-03-21 |
| 發明(設計)人: | 韓毛振;張雁;曹杰;汪棟;羅學才 | 申請(專利權)人: | 安徽醫科大學 |
| 主分類號: | G16B25/00 | 分類號: | G16B25/00;G16B50/00 |
| 代理公司: | 合肥中谷知識產權代理事務所(普通合伙) 34146 | 代理人: | 洪玲 |
| 地址: | 230000 安*** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 orthomcl 結果 快速 分析 方法 | ||
本發明公開了一種基于OrthoMCL聚類結果的快速分析方法,屬于比較基因組學和生物信息學領域,該方法以OrthoMCL聚類結果為基礎,建立自動對泛基因組分析中各類蛋白的識別,包括所有代表性蛋白質、核心蛋白質、單拷貝核心蛋白質和物種特異性蛋白質。基于這些蛋白質各自的分類,對這些分類的蛋白質在各自物種中存在的個數進行統計,并按照類別將結果進行輸出。該方法實現了對各種分類中蛋白質的代表性序列的輸出以及各類蛋白在每個物種中的代表性序列的輸出。此外,該方法也將蛋白質同源聚類結果按照每一個同源蛋白質對應的序列進行輸出,為實現泛基因組分析中更為高級的個性化分析奠定基礎。
技術領域
本發明涉及比較基因組學和生物信息學領域,尤其涉及一種基于OrthoMCL聚類結果的快速分析方法。
背景技術
比較基因組學(Comparative Genomics)是從進化的角度分析不同物種的基因組數據,對已知的基因和基因組結構進行比較,從而解析基因的功能以及基因與疾病和表型之間的遺傳學機制(C.Setubal et al.,2017,Shilei Zhao et al.,2019)。隨著測序技術的快速發展,特別是二代、三代測序技術的發展革新,眾多物種的基因組已經測序完成,越來越多的物種都在種水平上有了多個樣本的群體基因組數據。如何快速有效地對這些基因組測序數據進行比較分析,是目前比較基因組學研究中方法開發的一個主要研究領域。
目前在泛基因組的分析中一般涉及到以下幾個方面的內容:同源蛋白質的聚類分析、對同源蛋白質聚類結果的分析、蛋白質的建樹和進化分析、蛋白質的功能注釋(包括但不限于碳水化合物功能的注釋(CAZyme)、蛋白質功能的注釋(COG和GO注釋)和代謝途徑的注釋(KEGG pathway)等)。在已開發的泛基因組分析工具中,已經有PGAP(Yongbing Zhaoet al.,2011)和EDGAR(J.Yu et al.,2017)和panX(Wei Ding et al.,2018)等工具。這些工具實現了泛基因組分析中所需的絕大部分內容,但是輸出結果一般是經過高度整合之后的。正是由于缺少對應的中間過程文件,特別是對蛋白質的同源聚類結果及其相應的統計文件和蛋白質序列文件,使得泛基因組分析中所需的個性化分析難以開展。因此,如何快速有效地對泛基因組分析中蛋白質的同源聚類結果進行分析和統計,并對相應的蛋白質進行分類(主要涉及到泛基因組分析中的核心蛋白質、單拷貝核心蛋白質、非必需蛋白質和特異性蛋白質)輸出相對應的代表性的蛋白質序列,為后續的分析提供輸入文件是實現泛基因組分析中的個性化分析的重要前提。但是目前也沒有專門的方法可供使用,開發此類方法是必要的。
在泛基因組分析中,實現物種內所有蛋白質的同源聚類是進行后續分析的基礎。目前相應的工具就包括OrthoMCL(https://orthomcl.org/orthomcl/),BLAST和Diamond(Wei Ding et al.,2018)等。其中OrthoMCL在泛基因組分析中是用來尋找直系同源基因和旁系同源基因,其使用具有詳細的教程,易上手,是目前泛基因組分析中使用較為廣泛的工具。其輸出結果所包含的同源聚類結果也較為系統和全面,是實現對泛基因組分析中確定各蛋白質分類的基礎文件。
基于以上原因,為了實現對泛基因組分析中更多高級的個性化分析,需要建立對蛋白質聚類結果的快速有效處理。因此針對泛基因組中的蛋白質聚類結果非常有必要運用比較基因組學和生物信息學的使用,提供一種針對OrthoMCL聚類結果,實現對其快速有效的分析方法。
發明內容
為了解決以上問題,本發明提出一種基于OrthoMCL聚類結果的快速分析方法,以解決現有技術沒有專門針對泛基因組分析中蛋白質的同源聚類結果進行分析和統計、對相應蛋白質進行快速分類、并輸出對應代表性蛋白質序列的方法。
本發明采用以下技術方案來實現:
本發明提供了一種基于OrthoMCL聚類結果的快速分析方法,包括以下步驟:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于安徽醫科大學,未經安徽醫科大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911044264.6/2.html,轉載請聲明來源鉆瓜專利網。





