[發明專利]一種測序數據的分類單元組分計算方法有效
| 申請號: | 202010399887.1 | 申請日: | 2020-05-12 |
| 公開(公告)號: | CN111599413B | 公開(公告)日: | 2021-03-16 |
| 發明(設計)人: | 梁忱;胡龍;吳蘇生;楊帆;肖念清;任用 | 申請(專利權)人: | 江蘇先聲醫學診斷有限公司;江蘇先聲醫療器械有限公司;北京先聲醫學檢驗實驗室有限公司 |
| 主分類號: | G16B30/10 | 分類號: | G16B30/10;G16B30/20;G16B40/00 |
| 代理公司: | 暫無信息 | 代理人: | 暫無信息 |
| 地址: | 210000 江蘇省南京*** | 國省代碼: | 江蘇;32 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 序數 分類 單元 組分 計算方法 | ||
本發明涉及一種測序數據的分類單元組分計算方法。本發明基于“測序讀出序列的次分類單元頻率”指標及其計算框架,用于衡量序列比對結果中分類單元誤比對的情況,能夠有效去除分類單元組分計算中的假陽性結果,提高組分計算的特異性和準確性。同時,本發明還通過剔除異常分類單元后重新統計的策略實現了誤比對序列向真實組分結果的回歸,有效校正了分類單元豐度的定量結果。
技術領域
本發明涉及生信分析領域,具體涉及一種測序數據的分類單元組分計算方法。
技術背景
感染類疾病是由病原微生物引起的一類病癥,感染源種類繁多且病患眾多,給全球各國的公共衛生帶來重大影響。根據世界衛生組織的數據,以2016年為例,僅下呼吸道感染即在全球導致約300萬人死亡。與此同時,感染類疾病的盲目治療所帶來的抗生素濫用問題也有日益嚴重的趨勢。而對于感染病原體的精準檢測是解決上述問題的最重要一環。
感染類疾病病原體檢測的傳統手段是微生物培養,但培養具有檢測時間長、靈敏度較低的缺點。聚合酶鏈式反應(以下簡稱PCR)方法檢測時間較短、靈敏度較高,但每次只能檢測一種病原體。基于測序技術的病原體檢測直接對樣本的全部DNA進行測序分析,具有檢測范圍廣、靈敏度高的特點。
納米孔測序技術是最近幾年興起的新一代測序技術。納米孔測序技術彌補了第二代測序平臺的劣勢,不僅測序片段的讀長較二代測序高出一到兩個數量級,而且建庫和測序時間短。此外,測序設備小巧便攜,數據能夠實時獲取并進行后續分析,較好地解決了測序場地的限制,以及報告反饋的延誤。因此這一技術非常適宜于感染微生物病原體檢測的應用。本技術領域常規的納米孔測序的物種組分計算流程如下:
1.測序運行過程中使用ONT MinKNOW軟件實時收集原始測序數據;
2.使用ONT Albacore或ONT Guppy軟件轉換原始電信號數據,生成堿基序列;
3.使用Minimap2軟件,進行基于hg38人類參考基因組的宿主序列去除;
4.使用What′s In My Pot?(WIMP)軟件計算物種組分,最后進行物種豐度過濾。
其中,使用WIMP軟件進行物種組分計算的過程為:
1.使用Centrifuge軟件進行序列比對;
2.根據每一條測序讀出序列的比對情況判斷其所屬物種;
3.統計每個物種的支持該物種的測序讀出序列數,計算出物種的絕對豐度和相對豐度;
4.對物種結果進行用戶定義的豐度過濾(例如使用1%的相對豐度閾值)。
但上述測序數據的常規分析方法存在物種結果假陽性較高(特異性較低)的缺陷,對于病原體結果準確性有很大影響。如何合理地去除序列比對過程中引入的物種假陽性,是現有技術中亟需解決的技術問題。
有鑒于此,提出本發明。
發明內容
本發明需要解決的核心問題是,如何通過數據分析方法盡量去除序列比對過程所引入的假陽性分類單元結果。考慮到測序數據的序列比對過程中,由于親緣關系鄰近的分類單元的基因組之間存在一定比例的相似序列,來源于某一分類單元的測序讀出序列可能誤比對到其他鄰近分類單元的基因組,進而引起分類單元組分計算的錯誤。面對誤比對現象,如果僅通過依次評估每條測序讀出序列的比對情況來確定某分類單元是否存在,假陽性結果總會得到部分保留,本發明開創性地采取一種包含了比對狀況整體統計(summary-based analysis)的計算框架來確定分類單元組分結果的真實與否。
現有的分類單元組分計算方法只是使用豐度篩選(例如去除相對豐度1%以下的分類單元)的策略來進行消極的假陽性去除,而并沒有構建一種通過評估比對結果的整體性分布規律來判斷誤比對引入的假陽性分類單元的積極策略。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于江蘇先聲醫學診斷有限公司;江蘇先聲醫療器械有限公司;北京先聲醫學檢驗實驗室有限公司,未經江蘇先聲醫學診斷有限公司;江蘇先聲醫療器械有限公司;北京先聲醫學檢驗實驗室有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010399887.1/2.html,轉載請聲明來源鉆瓜專利網。
- 上一篇:一種Spark分析結果的傳輸方法及裝置
- 下一篇:一種激光器穩定性測試系統





