[發明專利]基于高通量測序的病原體分析方法、裝置和計算機設備有效
| 申請號: | 202011137959.1 | 申請日: | 2020-10-22 |
| 公開(公告)號: | CN112259167B | 公開(公告)日: | 2022-09-23 |
| 發明(設計)人: | 于闖;張優勁;賀增泉;王今安;晉向前 | 申請(專利權)人: | 深圳華大基因科技服務有限公司 |
| 主分類號: | G16B30/10 | 分類號: | G16B30/10;G16B30/20;G16B50/00 |
| 代理公司: | 北京集佳知識產權代理有限公司 11227 | 代理人: | 蘇云輝 |
| 地址: | 518000 廣東省深圳市鹽田區*** | 國省代碼: | 廣東;44 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 通量 病原體 分析 方法 裝置 計算機 設備 | ||
本發明提供了一種基于高通量測序的病原體分析方法、裝置和計算機設備,其方法包括獲取待分析樣本的測序數據,將測序數據的每一條序列按照K?mer進行切分,得到多個K?mer;對多個K?mer進行哈希計算,并根據哈希計算后的K?mer在預先建立的基因組哈希表查找每一條序列的所有K?mer所對應的基因組位置和權重;根據每一條序列的所有K?mer對應的權重計算出每一條序列的總權重;根據每一條序列的所有K?mer所對應的基因組位置和每一條序列的總權重進行分類分析,確定病原體的物種屬性。該方法只需要確定待分析的樣本的每一條序列的K?mer所在的位置以及權重即可確定物種屬性且準確率高。
技術領域
本發明涉及數據處理技術領域,具體涉及一種基于高通量測序的病原體分析方法、裝置、計算機設備和可讀存儲介質。
背景技術
隨著二代測序技術的逐漸成熟,越來越多的基于二代測序的科技被用在醫學和科研領域。其中病原體檢測就是一個典型的應用。眾所周知,人類身上發生的疾病有很大一部分是外部的病原體侵入導致的,那么確認病原體就成為了醫治病癥挽救生命的關鍵。在二代測序技術不成熟之前,最為普遍的方法是通過血常規檢查確定病原體是否為病毒或者細菌,然后再使用抗生素或者干擾素來進行醫治,但這樣并不能高效針對對應的病原體,并且容易帶來藥物的濫用引發抗藥性。接著有了實驗室培養組織然后確定病原體,但這種方式有著時間長、判斷病原體高度依賴人工的缺點。而二代測序技術的引入解決了以上的難題,通過基因測序我們可以得到組織中所有的遺傳信息,并且根據遺傳信息我們可以精確得到病原體的基因組信息,然后根據已知數據庫進行比對得到最終的病原體種類的判斷。
然而目前的病原體高通量基因檢測方法是采集樣本后將樣本進行核酸提取建庫,然后通過高通量測序得到基因序列的fastq文件,然后通過bwa(序列比對軟件)將序列比對到人類染色體組的真實位置,將比對上的人類基因組的序列排除后再次與其他物種信息的序列進行比對,最終根據比對的序列情況判定病原體的物種,生成分析報告。該方法需要重復的比對人類基因組與不同的物種基因組,導致分析的時間過長,比對效率低。
發明內容
有鑒于此,本發明提供了一種基于高通量測序的病原體分析方法、裝置、計算機設備和可讀存儲介質來解決目前的病原體高通量基因檢測方法需要重復的比對人類基因組與不同的物種基因組,導致分析的時間過長,比對效率低的技術問題。
一種基于高通量測序的病原體分析方法,包括以下步驟:
獲取待分析樣本的測序數據,將所述測序數據的每一條序列按照K-mer進行切分,得到多個K-mer;
對多個所述K-mer進行哈希計算,并根據哈希計算后的K-mer在預先建立的基因組哈希表進行查找,得到每一條序列的所有K-mer所對應的基因組位置和權重;其中,預先建立的基因組哈希表是通過對已知的人類基因組的序列和病原體基因組的序列進行K-mer切分,對K-mer分配權重,并將分配權重后的K-mer使用散列函數映射到哈希表而得到的;其中,所述K-mer的長度為正整數;
根據每一條序列的所有K-mer所對應的權重計算出每一條序列的總權重;
根據每一條序列的所有K-mer所對應的基因組位置和每一條序列的總權重進行分類分析,確定病原體的物種屬性。
可選地,
所述基因組哈希表的建立步驟,包括:
獲取已知的人類基因組的序列和病原體基因組的序列;
選取K-mer,按照所述K-mer對所述人類基因組的序列和所述病原體的序列進行切分,得到多個K-mer;
對多個所述K-mer進行統計分析,并對每一個K-mer分配權重;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于深圳華大基因科技服務有限公司,未經深圳華大基因科技服務有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011137959.1/2.html,轉載請聲明來源鉆瓜專利網。





