[發明專利]一種基于高通量測序數據的溶源性噬菌體預測方法有效
| 申請號: | 201910506027.0 | 申請日: | 2019-06-12 |
| 公開(公告)號: | CN110211628B | 公開(公告)日: | 2022-06-07 |
| 發明(設計)人: | 彭紹亮;牛琦;童貽剛;張湘莉蘭;李肯立;曲強;謝湘成 | 申請(專利權)人: | 湖南大學 |
| 主分類號: | G16B15/30 | 分類號: | G16B15/30;G16B20/30 |
| 代理公司: | 國防科技大學專利服務中心 43202 | 代理人: | 王文惠 |
| 地址: | 410012 湖*** | 國省代碼: | 湖南;43 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 基于 通量 序數 溶源性 噬菌體 預測 方法 | ||
本發明屬于生物信息學領域,公開了一種基于高通量測序數據的溶源性噬菌體預測方法,通過將原始測序數據和拼接后的細菌基因組數據相結合,先設計了質控過濾流水線對原始測序數據進行質控和過濾,再在拼接后的細菌基因組基因片段上根據類噬菌體基因聚類簇預測出粗略前噬菌體范圍,接著在粗略范圍上根據整合位點搜索出精確前噬菌體候選對象,最后從原始測序數據中挖掘環化信息,驗證前噬菌體功能性并基于一致性延伸算法提取出對應的溶原性噬菌體全序。本發明實現了對細菌基因組中的溶源性噬菌體的有效預測,具有十分重要的推廣應用價值。
技術領域
本發明涉及一種基于高通量測序數據的溶源性噬菌體預測方法,屬于生物信息學領域。
背景技術
噬菌體作為細菌的專性寄生微生物,是與細菌的長期演化過程中形成的可感染細菌的病毒,它可以分為裂解性噬菌體和溶原性噬菌體。裂解性噬菌體能在敏感宿主菌體內增殖并使之裂解死亡;而溶原性噬菌體雖然在某些理化因素影響下也可導致宿主菌的裂解,但將基因組整合于宿主菌基因組中,隨細菌基因組進行復制及傳代是其主要的存在方式,此時的溶原性噬菌體和宿主菌之間建立起相對穩定的寄生關系。溶原性噬菌體整合進宿主菌基因組中稱之為前噬菌體。由于溶原性噬菌體具有介導基因水平轉移的特性,通常可以對細菌的致病性造成重大影響。因此,為了更好地理解細菌毒力的形成,更準確地預測溶原性噬菌體在細菌上的存在情況是十分必要的。然而目前對于溶原性噬菌體的發現主要采用實驗誘導和生物信息推斷等人工方式,效率十分低下。另一方面,目前的自動化預測工具也只能預測到細菌基因組上的前噬菌體,而不能判斷其是否具有功能性,更無法提取出功能性前噬菌體對應溶原性噬菌體完整序列。有鑒于此,有必要發明一種方法,該方法既能精準預測前噬菌體范圍,又能有效驗證前噬菌體的功能性,進而對溶源性噬菌體的基因全序進行提取。
發明內容
針對上述問題,本發明提供一種基于高通量測序數據的溶源性噬菌體預測方法。
為了實現上述目的,本發明的解決方案是:
一種基于高通量測序數據的溶源性噬菌體預測方法,包括如下步驟:
第一步、開始對原始測序數據的質量值進行控制和過濾:為保證對基因組進行測序時的準確性,定義測序得到的每個堿基的質量值表示各個堿基的置信度的度量標準,表示此堿基測序錯誤的概率,質量值越高說明錯誤率越低,測序準確率就越高;如果測序質量值偏低,則會對拼接效果造成不良影響,因此必須對質量值進行過濾,去除質量值較差的序列;
第二步、準備對高質量數據進行測序并組裝:為方便測序,會人為地添加一種短片段,稱為接頭,最后的測序結果可能會殘存接頭序列,從而影響拼接的結果,因此需要人為地建立接頭數據庫,把測序數據中的堿基序列逐個與接頭數據庫中的序列進行比較,刪除相同序列,完成對接頭序列的過濾,得到凈化后的數據進行拼接組裝;
第三步、粗略前噬菌體預測:構建噬菌體蛋白質數據庫,利用該數據庫注釋宿主菌的DNA,將呈現成簇聚集特征的噬菌體基因區域作為前噬菌體區域,再進行搜索并注釋在細菌基因組上的整合酶基因,將整合酶基因的上下游約一個前噬菌體基因組的區域估計為疑似存在前噬菌體的區域,其長度約90000bp;
第四步、精確前噬菌體預測:尋找定義了前噬菌體基因組邊界的兩個成對出現的特有的短正向重復序列attL和attR,長度一般在14-50bp之間,且可以取端點值;在粗略前噬菌體范圍上設置兩個“滑動窗口”,兩個窗口差分的距離為e,其中e代表重復序列的距離,并設置兩輪迭代;第一輪迭代改變兩個窗口差分的距離,然后第二輪迭代從各窗口前端進行逐個堿基對比,把相同的堿基串記錄下來,就是短正向重復序列attL和attR,兩個短正向重復序列之間的范圍即是精確的前噬菌體范圍;
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于湖南大學,未經湖南大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201910506027.0/2.html,轉載請聲明來源鉆瓜專利網。





