[發明專利]宏基因組的重組裝方法、重組裝裝置及終端設備在審
| 申請號: | 201911416602.4 | 申請日: | 2019-12-31 |
| 公開(公告)號: | CN111161798A | 公開(公告)日: | 2020-05-15 |
| 發明(設計)人: | 余珂;喬雪姣;張立羽;謝克聰 | 申請(專利權)人: | 余珂 |
| 主分類號: | G16B20/00 | 分類號: | G16B20/00;G16B30/20 |
| 代理公司: | 深圳中一聯合知識產權代理有限公司 44414 | 代理人: | 符亞飛 |
| 地址: | 518000 廣東省深圳市*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 宏基 組裝 方法 裝置 終端設備 | ||
本申請適用于生物信息技術領域,一種宏基因組的重組裝方法、重組裝裝置及終端設備,包括:獲取經過基因組裝處理和宏基因組分箱處理后的初始基因組集合,所述初始基因組集合中包括多個微生物基因組;提取所述初始基因組集合中每個物種的非冗余基因組,其中,所述非冗余基因組為所屬物種對應的目標基因個數最多的微生物基因組;對各個非冗余基因組分別進行重組裝處理,得到重組裝后的微生物基因組。通過上述方法,能夠得到質量較高的微生物基因組,進而為后續的基因研究提供了可靠的研究對象。
技術領域
本申請屬于生物信息技術領域,尤其涉及一種宏基因組的重組裝方法、重組裝裝置及終端設備。
背景技術
宏基因組是環境中全部微小生物遺傳物質的總和,包含了可培養和不可培養的微生物的基因。以宏基因組為研究對象的研究方法稱為宏基因組學,該方法不需要進行微生物培養,可以直接對取自環境樣品中的核苷酸序列進行分析和研究。
目前,宏基因組學包括提取環境樣品中的基因組數據(如核苷酸序列)、對提取的基因組數據進行測序得到基因測序序列、對基因測序序列進行基因組裝處理得到重疊群、對重疊群進行宏基因組分箱處理得到微生物基因組、以及對得到的微生物基因組進行基因研究等。但是,通過現有的宏基因組分箱方法得到的微生物基因組缺少較多的基因特征,微生物基因組的質量較差,無法為后續的基因研究提供可靠的研究對象。
發明內容
本申請實施例提供了一種宏基因組的重組裝方法、重組裝裝置及終端設備,可以解決現有的宏基因組分箱方法得到的微生物基因組的質量較差的問題。
第一方面,本申請實施例提供了一種宏基因組的重組裝方法,包括:
獲取經過基因組裝處理和宏基因組分箱處理后的初始基因組集合,所述初始基因組集合中包括多個微生物基因組;
提取所述初始基因組集合中每個物種的非冗余基因組,其中,所述非冗余基因組為所屬物種對應的目標基因個數最多的微生物基因組;
對各個非冗余基因組分別進行重組裝處理,得到重組裝后的微生物基因組。
在第一方面的一種可能的實現方式中,所述初始基因組集合中包括M×H個子集合,其中,M為基因組裝方法的種類數,H為N種宏基因組分箱方法的參數的總和,Ln為第n種宏基因組分箱方法的參數的個數,基于第m種基因組裝方法進行基因組裝處理、并基于第h個參數以及第h個參數對應的宏基因組分箱方法進行宏基因組分箱處理后得到的至少一個微生物基因組為一個子集合,M、H、N和Ln均為正整數,mM,hH。
在第一方面的一種可能的實現方式中,所述初始基因組集合包括M個第一集合,每個第一集合包括基于相同的基因組裝方法處理得到的微生物基因組,所述提取所述初始基因組集合中每個物種的非冗余基因組,包括:
提取每個第一集合中的每個物種的非冗余基因組,得到第二集合,所述第二集合包括從M個第一集合中提取的非冗余基因組;
提取所述第二集合中的每個物種的非冗余基因組。
在第一方面的一種可能的實現方式中,對于所述第一集合和所述第二集合中的任一集合,提取所述集合中每個物種的非冗余基因組,包括:
分別計算所述集合中每個微生物基因組的測序覆蓋率,并根據所述測序覆蓋率將所述集合中的各個微生物基因組劃分為多個物種,每個物種包括K個微生物基因組;
對于每個物種,當K=1時,確定屬于所述物種的一個微生物基因組為所述物種的非冗余基因組;
當K1時,確定屬于所述物種的K個微生物基因組中目標基因個數最多的微生物基因組為所述物種的非冗余基因組;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于余珂,未經余珂許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201911416602.4/2.html,轉載請聲明來源鉆瓜專利網。





