[發明專利]宏基因組的基因分析方法、裝置、設備及存儲介質有效
| 申請號: | 201710838808.0 | 申請日: | 2017-09-18 |
| 公開(公告)號: | CN107832584B | 公開(公告)日: | 2021-06-22 |
| 發明(設計)人: | 郭寧;魏彥杰;張慧玲;葛健秋;滕彥寧 | 申請(專利權)人: | 中國科學院深圳先進技術研究院 |
| 主分類號: | G16B15/20 | 分類號: | G16B15/20;G06N20/00 |
| 代理公司: | 深圳智趣知識產權代理事務所(普通合伙) 44486 | 代理人: | 王策 |
| 地址: | 518000 廣東省深圳*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 宏基 基因 分析 方法 裝置 設備 存儲 介質 | ||
1.一種宏基因組的基因分析方法,其特征在于,所述方法包括下述步驟:
接收用戶輸入的宏基因組的測序數據,對所述每組測序數據進行篩選和組裝,生成所述每組測序數據對應的組裝數據;
通過對所述每組組裝數據進行基因預測,生成所述每組測序數據的預測基因,根據所述預測基因構建所述宏基因組的基因字典;
統計所述基因字典中每條基因相對于所述篩選后的所有測序數據的豐度,根據所述每條基因的豐度對所述基因字典中的基因進行聚類,獲得聚類后的基因簇;
根據所述基因簇對所述篩選后的每組測序數據進行分類和組裝,生成并輸出所述宏基因組的基因。
2.如權利要求1所述的方法,其特征在于,對所述每組測序數據進行篩選和組裝,生成所述每組測序數據對應的組裝數據的步驟,包括:
根據預設的質量閾值和所述每組測序數據中每個讀長數據的測序質量,對所述每組測序數據進行過濾;
對所述過濾后的每組測序數據中的讀長數據進行組裝,生成所述過濾后的每組測序數據對應的所述組裝數據。
3.如權利要求1所述的方法,其特征在于,根據所述預測基因構建所述宏基因組的基因字典的步驟,包括:
對所述所有預測基因進行組合,以得到對應的預測基因集合,計算所述預測基因集合中每對預測基因的相似度;
將所述預測基因集合中所述相似度超過預設相似閾值的每對預測基因進行合并,將所述合并后的所述預測基因集合設置為所述基因字典。
4.如權利要求1所述的方法,其特征在于,統計所述基因字典中每條基因相對于所述篩選后的所有測序數據的豐度,根據所述每條基因的豐度對所述基因字典中的基因進行聚類,獲得聚類后的基因簇的步驟,包括:
根據所述篩選后的所有測序數據的讀長數據在所述基因字典中每條基因上的分布,統計所述基因字典中每條基因的豐度;
將所述基因字典中每條基因的豐度設置為所述基因字典中每條基因的聚類特征,根據所述基因字典中每條基因的聚類特征,對所述基因字典中的基因進行聚類,生成所述基因簇。
5.如權利要求1所述的方法,其特征在于,根據所述基因簇對所述篩選后的每組測序數據進行分類和組裝,生成并輸出所述宏基因組的基因的步驟,包括:
根據所述基因簇對所述篩選后的每組測序數據中的讀長數據進行分類,分別將屬于所述每個基因簇的所述讀長數據進行組裝;
將由所述讀長數據組裝得到的組裝數據設置為所述宏基因組的基因并輸出。
6.一種宏基因組的基因分析裝置,其特征在于,所述裝置包括:
測序組裝單元,用于接收用戶輸入的宏基因組的測序數據,對所述每組測序數據進行篩選和組裝,生成所述每組測序數據對應的組裝數據;
基因預測單元,用于通過對所述每組組裝數據進行基因預測,生成所述每組預測數據的預測基因,根據所述預測基因構建所述宏基因組的基因字典;
基因聚類單元,用于統計所述基因字典中每條基因相對于所述篩選后的所有測序數據的豐度,根據所述每條基因的豐度對所述基因字典中的基因進行聚類,獲得聚類后的基因簇;以及
基因輸出單元,用于根據所述基因簇對所述篩選后的每組測序數據進行分類和組裝,生成并輸出所述宏基因組的基因。
7.如權利要求6所述的裝置,其特征在于,所述測序組裝單元包括:
數據過濾單元,用于根據預設的質量閾值和所述每組測序數據中每個讀長數據的測序質量,對所述每組測序數據進行過濾;以及
數據組裝單元,用于對所述過濾后的每組測序數據中的讀長數據進行組裝,生成所述過濾后的每組測序數據對應的所述組裝數據。
8.如權利要求6所述的裝置,其特征在于,所述基因預測單元包括:
相似度計算單元,用于對所述所有預測基因進行組合,以得到對應的預測基因集合,計算所述預測基因集合中每對預測基因的相似度;以及
字典生成單元,用于將所述預測基因集合中所述相似度超過預設相似閾值的每對預測基因進行合并,將所述合并后的所述預測基因集合設置為所述基因字典。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院深圳先進技術研究院,未經中國科學院深圳先進技術研究院許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710838808.0/1.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:監測生物過程的方法
- 下一篇:一種混凝土彈性模量測定儀





