[發明專利]基于高通量測序技術的宿主中病毒來源sRNA數據分析方法有效
| 申請號: | 202110354949.1 | 申請日: | 2021-04-01 |
| 公開(公告)號: | CN113066532B | 公開(公告)日: | 2022-08-26 |
| 發明(設計)人: | 肖云平;徐天生;楊雨晴;劉鈺釧;史賢俊;林博 | 申請(專利權)人: | 上海歐易生物醫學科技有限公司 |
| 主分類號: | G16B20/30 | 分類號: | G16B20/30;G16B30/10;G16B45/00 |
| 代理公司: | 上海德禾翰通律師事務所 31319 | 代理人: | 夏思秋 |
| 地址: | 201114 上海市閔行*** | 國省代碼: | 上海;31 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 基于 通量 技術 宿主 病毒 來源 srna 數據 分析 方法 | ||
本發明提出了一種基于高通量測序技術的宿主中病毒來源sRNA數據分析方法,包括文件準備步驟、下機數據質控步驟、病毒參考基因組比對以及病毒sRNA注釋步驟、病毒sRNA定量步驟、差異病毒sRNA分析步驟、宿主靶基因預測步驟、富集分析步驟、網頁版報告整理步驟。本發明結果全面,包含涉及到的病毒sRNA分析內容以及其宿主靶基因預測,GO、KEGG富集分析以及對應的可視化展示;自動整理所有分析結果,每一步分析完成之后自動對結果進行匯總統計、可視化以及邏輯化歸類整理,結果文件可直接用于生成網頁版報告,所有操作步驟可以溯源,方便錯誤查詢,如果分析有報錯,會生成對應的報錯日志信息。
技術領域
本發明屬于高通量轉錄組測序技術領域,具體涉及一種基于高通量測序技術的宿主中病毒來源sRNA數據分析方法。
背景技術
Small RNA(sRNA)是一類長度小于200nt的非編碼短鏈RNA分子,sRNA通常具備的功能是沉默靶基因,抑制靶基因行使功能。
宿主感染病毒之后,病毒sRNA作為外源sRNA會參與宿主的生物學過程,比如行使類似于miRNA的生物學功能,沉默宿主的靶基因,進而參與影響宿主的生物學過程。單獨病毒sRNA的研究和鑒定已經有相關的工具。目前還沒有針對宿主中病毒來源sRNA的數據分析工具,特別是沒有自動化的分析實現病毒sRNA和宿主靶基因的交互作用,以及測序結果的流程化分析工具,包括病毒sRNA的注釋,表達量分析和差異分析,宿主靶基因位點分析,GO、KEGG功能富集分析等各個步驟的自動化整合。
現有的病毒sRNA高通量分析方法存在如下缺陷:
(1)適用性不強:缺少考慮病毒和宿主之間轉錄層面的聯系;
(2)結果展示不完整:分析結果過于簡單,數據挖掘的不深入,缺少數據對應的可視化展示內容。
發明內容
為了克服現有技術所存在的上述缺陷,本發明的目的在于提供一種基于高通量測序技術的宿主中病毒來源sRNA數據分析方法。
為了實現本發明的目的,所采用的技術方案是:
本發明提供了一種基于高通量測序技術的宿主中病毒來源sRNA數據分析方法,包括如下步驟:
(1)文件準備步驟:
準備config文件,讀取后用于進行數據自動化質控以及后續數據分析;
在本發明的一個優選實施方式中,所述文件準備步驟當中config文件包括:下機數據位置以及對應的樣本分析名和分組名、用于差異分析的分組信息、差異倍數參數、生物學重復參數、參考基因組信息等。
(2)下機數據質控步驟:
將下機得到的原始數據,通過Cutadapt、FastQC、Fastx-Toolkit、NGS_QC_Toolkit軟件去除接頭序列處理,保留15-41nt長度的序列,然后過濾低質量序列,即:以5個堿基長度為窗口對原始序列進行搜索,當窗口中堿基的平均測序質量低于20時,將從窗口最前端開始的部分截斷并舍棄。將過濾后的數據進行去重,獲得無重復的序列,并標記所有序列的數量。同時對原始數據和過濾數據量進行統計,并以柱狀圖展示各個樣本不同長度序列的數量分布特征。
過濾序列用于后續分析;
在本發明的另一個優選實施方式中,所述下機數據質控步驟中,使用FastQC軟件對去除接頭的序列做質控,匯總包括序列的測序質量統計、GC含量統計等質控信息;然后使用NGS_QC_Toolkit軟件對上述去除低質量堿基的序列做N堿基檢測,序列中含有一個及以上的N堿基則將該條序列剔除;然后使用Fastx-Toolkit軟件將剔除含N堿基的序列轉成fasta格式的序列文件。
(3)病毒參考基因組比對以及病毒sRNA注釋步驟:
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于上海歐易生物醫學科技有限公司,未經上海歐易生物醫學科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110354949.1/2.html,轉載請聲明來源鉆瓜專利網。





