[發(fā)明專利]一種大氣氣溶膠微生物群落組成的分析方法在審
| 申請?zhí)枺?/td> | 202110394632.0 | 申請日: | 2021-04-13 |
| 公開(公告)號: | CN113077845A | 公開(公告)日: | 2021-07-06 |
| 發(fā)明(設計)人: | 陳彬;蕫笑菲 | 申請(專利權)人: | 中國科學院大氣物理研究所 |
| 主分類號: | G16B40/10 | 分類號: | G16B40/10;G16B40/30;G16B25/20;G16B50/10;G16B45/00;C12Q1/6869 |
| 代理公司: | 北京市盛峰律師事務所 11337 | 代理人: | 席小東 |
| 地址: | 100029 北京市朝*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 大氣 氣溶膠 微生物 群落 組成 分析 方法 | ||
1.一種大氣氣溶膠微生物群落組成的分析方法,其特征在于,包括以下步驟:
步驟1,獲得大氣氣溶膠樣本,提取得到所述大氣氣溶膠樣本中的微生物DNA;
步驟2,采用細菌通用引物515F/806R,以步驟1的所述微生物DNA為模板,進行PCR擴增,得到擴增產物;
步驟3,對所述擴增產物進行高通量雙端測序,得到雙端測序結果;
步驟4,對所述雙端測序結果進行質量過濾,去除非生物核酸序列,包括引物序列和接頭序列,得到質量過濾后的雙端測序結果;所述質量過濾后的雙端測序結果,包括多個雙端測序序列;每個所述雙端測序序列包括成對的正向測序序列和反向測序序列;其中,對于成對的正向測序序列和反向測序序列,通過標記序列進行標記;
步驟5,將雙端測序結果中的所有正向測序序列存入到一個正向序列文件中;
將雙端測序結果中的所有反向測序序列存入到一個反向序列文件中;
步驟6,對于正向序列文件中的每個正向測序序列,均進行數(shù)據(jù)剪切過濾處理;
其中,數(shù)據(jù)剪切過濾方法為:
步驟6.1,設置過濾參數(shù),包括序列最小長度a,數(shù)據(jù)前端剪切掉的堿基數(shù)量b;
步驟6.2,對于當前的正向測序序列,表示為正向測序序列seq(L0),判斷其前端剪切掉b個堿基后,剩余序列長度是否大于a,如果大于,則執(zhí)行步驟6.3;否則,執(zhí)行步驟6.4;
步驟6.3,將正向測序序列seq(L)的前端剪切掉b個堿基,得到過濾后的正向測序序列seq(L1);
步驟6.4,不對正向測序序列seq(L0)進行剪切過濾處理,輸出正向測序序列seq(L0);
步驟7,經步驟6處理,得到多個正向測序序列;每個正向測序序列作為一個正向樣本,從而形成正向樣本池;
對正向樣本池進行錯誤率識別,剔除錯誤的正向測序序列,保留真實的正向測序序列,從而得到所有真實的正向測序序列形成的正向真實樣本池;
步驟8,對正向真實樣本池中的各個正向測序序列進行冗余識別,去除重復的正向測序序列,從而得到冗余處理后的正向真實樣本池;
步驟9,對于步驟5得到的反向序列文件,采用步驟6-步驟8的方式處理,得到冗余處理后的反向真實樣本池;
步驟10,從冗余處理后的正向真實樣本池和冗余處理后的反向真實樣本池中,根據(jù)標記序列,識別到成對的正向測序序列和反向測序序列;
對成對的正向測序序列和反向測序序列,采用以下方式進行序列拼接處理:
判斷成對的正向測序序列和反向測序序列是否滿足以下序列拼接條件:正向測序序列和反向測序序列具有重疊區(qū)域;并且,重疊區(qū)域中的堿基數(shù)量大于設定閾值;
如果不滿足,則不進行序列拼接,并將本對正向測序序列和反向測序序列剔除;
如果滿足,則使正向測序序列和反向測序序列在重疊區(qū)域拼接,得到合并序列;
步驟11,由此得到由多個合并序列組成的合并序列文件;
對合并序列文件中的各個合并序列進行物種注釋,物種注釋方法為:
步驟11.1,讀取基因數(shù)據(jù)庫;其中,所述基因數(shù)據(jù)庫存儲已知的基因名稱以及基因DNA序列的對應關系;
步驟11.2,從基因數(shù)據(jù)庫中提取與測序引物匹配的多個基因,得到基因參考數(shù)據(jù)庫;
步驟11.3,以基因參考數(shù)據(jù)庫中的各個已知分類的參考序列作為訓練集,將訓練集作為輸入,對預建立的分類器進行訓練,得到訓練完成的分類器;
步驟11.4,以步驟10輸出的每個合并序列作為樣本,輸入到分類器,分類模型輸出對每個合并序列的物種分類結果,對物種分類結果進行注釋,從而得到對各個合并序列的注釋結果文件;
步驟11.5,將合并序列的注釋結果可視化顯示;
步驟12,基于步驟11得到的各個合并序列的注釋結果,對注釋結果進行過濾,得到過濾后的注釋結果,過濾方法為:
基于物種注釋結果,去除線粒體和葉綠體物種,保留屬于細菌門的序列;
步驟13,基于步驟12得到的過濾后的注釋結果,對群落結構多樣性進行討論與檢驗;具體的,通過系統(tǒng)發(fā)育分析、組間差異分析以及稀釋曲線繪制,獲得大氣氣溶膠微生物群落結構特征信息。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于中國科學院大氣物理研究所,未經中國科學院大氣物理研究所許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業(yè)授權和技術合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110394632.0/1.html,轉載請聲明來源鉆瓜專利網。





