[發明專利]基于宏基因組的抗性基因分析方法、裝置、介質及終端在審
| 申請號: | 202011289003.3 | 申請日: | 2020-11-17 |
| 公開(公告)號: | CN113611357A | 公開(公告)日: | 2021-11-05 |
| 發明(設計)人: | 丁赟;韓繼臣;趙建華;羅春 | 申請(專利權)人: | 上海美吉生物醫藥科技有限公司 |
| 主分類號: | G16B20/00 | 分類號: | G16B20/00;G16B30/10;G06F16/26;G16B50/30 |
| 代理公司: | 上海光華專利事務所(普通合伙) 31219 | 代理人: | 倪靜 |
| 地址: | 201321 上海市浦東新區中國(上海)*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 宏基 抗性 基因 分析 方法 裝置 介質 終端 | ||
本發明提供基于宏基因組的抗性基因分析方法、裝置、介質及終端。所述方法包括:獲取多個宏基因組樣本的測序原始數據,并對其進行序列質控以獲得各宏基因組樣本的優化數據;將所述優化數據分別與物種、抗性基因、可移動元件和個性化功能參考數據庫進行序列對比,以獲得其對應的注釋信息;基于所述注釋信息統計各樣本的豐度信息、占比信息;對所述豐度信息、占比信息和注釋信息進行數據挖掘分析,獲取抗性基因與物種、可移動元件及個性化功能之間的相關性信息。本發明有利于快速、全面地了解環境中的物種組成、功能組成、抗生素抗性基因在環境中的分布和可移動性等,并且挖掘了抗生素抗性基因與物種、可移動元件及個性化功能之間的相關性。
技術領域
本發明涉及計算機科學與生物信息學交叉的技術領域,特別是涉及基于宏基因組的抗性基因分析方法、裝置、介質及終端。
背景技術
近年來,由于抗生素濫用等因素造成的抗生素耐藥性問題受到越來越多的政府及組織的關注。同時,抗生素抗性基因作為一種新興的環境污染物,存在于土壤、水體、人體等各類環境中并且能夠通過水平基因轉移從宿主轉移到其它生物體當中,在環境中進行傳播,造成更嚴重的污染問題,所以研究環境中抗生素抗性基因的分布等情況成為很多學者的研究熱點。
宏基因組學作為一種組學技術,范圍可以覆蓋到整個環境中的微生物,對于研究環境中的抗生素抗性基因是比較適合的技術。但是目前已有的一些面向宏基因組學數據的抗生素抗性基因分析工具,第一是功能不夠完善,比如僅僅能夠獲取環境中的抗生素抗性基因信息,但是卻無法知道其對應的物種情況或是可移動性;第二是數據適用性比較單一,只能支持二代測序平臺產出的原始數據,或者是只支持質控好的優化數據;第三是無法進行更深入的分析,只能獲取到基本的抗生素抗性基因的組成情況,但是其在不同環境處理下有無差異、與其它關注的功能有無關聯等這些問題都無法得到進一步了解。這使得對抗生素抗性基因的研究不夠方便,需要花費額外的時間去尋找不同的工具實現想要的一些分析。
發明內容
鑒于以上所述現有技術的缺點,本發明的目的在于提供基于宏基因組的抗性基因分析方法、裝置、介質及終端,面向宏基因組學數據,對其進行抗性基因注釋、可移動元件識別、物種分類以及個性化功能標識,并根據研究者實際需求對數據進行進一步的挖掘分析,從而快速、全面地了解抗生素抗性基因在環境中的分布、傳播等情況,同時也可獲取環境中的物種組成、功能組成等其它情況,并且挖掘了抗生素抗性基因與物種、可移動元件及個性化功能之間的相關性。
為實現上述目的及其它相關目的,本發明的第一方面提供一種基于宏基因組的抗性基因分析方法,包括:獲取多個宏基因組樣本的測序原始數據,并對其進行序列質控以獲得各宏基因組樣本的優化數據;將所述各宏基因組樣本的優化數據分別與物種參考數據庫、抗性基因參考數據庫、可移動元件參考數據庫和個性化功能參考數據庫進行序列對比,以獲得其對應的物種注釋信息、抗性基因注釋信息、可移動元件注釋信息和功能注釋信息;基于所述優化數據對應的注釋信息,統計各樣本的物種豐度信息、各抗性基因分類水平豐度信息、可移動元件占比信息和各功能分類水平豐度信息;對所述優化數據對應的豐度信息、占比信息和注釋信息進行數據挖掘分析,獲取抗性基因與物種、可移動元件及個性化功能之間的相關性信息。
于本發明的第一方面的一些實施例中,所述方法還包括:對所述優化數據進行序列組裝,以獲取其對應的重疊群;對所述重疊群進行基因預測,以獲取其對應的開放閱讀框;將所述開放閱讀框分別與物種參考數據庫、抗性基因參考數據庫、可移動元件參考數據庫和個性化功能參考數據庫進行序列對比,以獲得其對應的物種注釋信息、抗性基因注釋信息、可移動元件注釋信息和功能注釋信息;基于所述開放閱讀框對應的注釋信息,統計各樣本的物種豐度信息、各抗性基因分類水平豐度信息、可移動元件占比信息和各功能分類水平豐度信息;對所述開放閱讀框對應的豐度信息、占比信息和注釋信息進行數據挖掘分析,獲取抗性基因與物種、可移動元件及個性化功能之間的相關性信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海美吉生物醫藥科技有限公司,未經上海美吉生物醫藥科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011289003.3/2.html,轉載請聲明來源鉆瓜專利網。





