[發明專利]一種用于對病原體類型進行自動分析的方法及系統在審
| 申請號: | 202110331835.5 | 申請日: | 2021-03-26 |
| 公開(公告)號: | CN113096737A | 公開(公告)日: | 2021-07-09 |
| 發明(設計)人: | 杜鵬程;余樂;劉樹青 | 申請(專利權)人: | 北京源生康泰基因科技有限公司 |
| 主分類號: | G16B30/10 | 分類號: | G16B30/10;G16B20/30 |
| 代理公司: | 北京工信聯合知識產權代理有限公司 11266 | 代理人: | 白曉晰 |
| 地址: | 100084 北京市海淀*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 用于 病原體 類型 進行 自動 分析 方法 系統 | ||
1.一種用于對病原體類型進行自動分析的方法,其特征在于,所述方法包括:
獲取與待測樣本對應的經核酸序列檢測得到的至少一個測序讀段數據;
確定所述至少一個測序讀段數據中的每個測序讀段數據的數據類型,并根據數據類型按照預設的數據清洗策略對所述至少一個測序讀段數據中每個測序讀段數據進行數據清洗,以獲取至少一個質量合格的第一測序讀段數據;
分別利用第一識別方法和第二識別方法對所述至少一個質量合格的第一測序讀段數據中的每個第一測序讀段數據進行病原體類型的初步識別,以分別獲取每個第一測序讀段數據對應的第一病原體類型識別結果和第二病原體類型識別結果;
根據每個第一測序讀段數據對應的第一病原體類型識別結果和第二病原體類型識別結果進行第二測序讀段數據的選取,獲取至少一個第二測序讀段數據,并根據識別出的病原體類型對所述至少一個第二測序讀段數據進行分類,以獲取不同的病原體類型對應的第二測序讀段數據集;
對于任一個第二測序讀段數據集,將該任一個第二測序讀段數據集中的每個第二測序讀段數據與該任一個第二測序讀段數據集對應的病原體類型的病原體參考序列進行比對,獲取該任一個第二測序讀段數據集中的每個第二測序讀段數據對應的比對結果;
根據每個第二測序讀段數據集中的每個第二測序讀段數據對應的比對結果確定所述待測樣本的最終病原體類型識別結果。
2.根據權利要求1所述的方法,其特征在于,所述根據數據類型按照預設的數據清洗策略對所述至少一個測序讀段數據中每個測序讀段數據進行數據清洗,以獲取至少一個質量合格的第一測序讀段數據,包括:
利用fastQC確定數據類型為二代測序數據的每個測序讀段數據的測序讀段數據質量,并篩選出測序讀段數據質量滿足預設的第一測序讀段數據質量標準的每個測序讀段數據均作為第一測序讀段數據;
利用Nanofilt確定數據類型為三代測序數據的每個測序讀段數據的測序讀段數據質量,并篩選出測序讀段數據質量滿足預設的第二測序讀段數據質量標準的每個測序讀段數據均作為第一測序讀段數據。
3.根據權利要求1所述的方法,其特征在于,所述根據每個第一測序讀段數據對應的第一病原體類型識別結果和第二病原體類型識別結果進行第二測序讀段數據的選取,獲取至少一個第二測序讀段數據,包括:
對于任一個第一測序讀段數據,若該任一個第一測序讀段數據對應的第一病原體類型識別結果指示識別出的病原體類型屬于預設的病原體類型集,則將該任一個第一測序讀段數據作為一個第二測序讀段數據;
對于任一個第一測序讀段數據,若該任一個第一測序讀段數據對應的第二病原體類型識別結果指示識別出的病原體類型屬于預設的病原體類型集且該任一個第一測序讀段數據與識別出的病原體類型對應的病原體參考序列的第一比對評分大于等于預設的評分閾值,且該任一個第一測序讀段數據中匹配到識別出的病原體類型對應的病原體參考序列的長度與該任一個第一測序讀段數據總長度的第一長度匹配比值大于等于預設的第一比值閾值,則將該任一個第一測序讀段數據作為一個第二測序讀段數據。
4.根據權利要求1所述的方法,其特征在于,所述比對結果,包括:每個第二測序讀段數據與識別出的病原體類型對應的病原體參考序列的第二比對評分、第二匹配長度比值、序列相似度和比對期望值。
5.根據權利要求4所述的方法,其特征在于,所述根據每個第二測序讀段數據集中的每個第二測序讀段數據對應的比對結果確定待測樣本的最終病原體類型識別結果,包括:
對于任一個測序讀段數據集,選取該任一個測序讀段數據集中第二比對評分最高的第二測序讀段數據作為目標測序讀段數據,并判斷所述目標測序讀段數據是否同時滿足第二匹配長度比值大于等于預設的第二比值閾值,且序列相似度大于等于預設的序列相似度閾值,且比對期望值小于等于預設的比對期望閾值;若滿足,則確定所述待測樣本中存在與所述目標測序讀段數據對應的病原體類型;
根據確定的所有的所述待測樣本中存在的病原體類型確定所述最終病原體類型識別結果。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京源生康泰基因科技有限公司,未經北京源生康泰基因科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110331835.5/1.html,轉載請聲明來源鉆瓜專利網。





