[發(fā)明專利]一種基于二代測序技術(shù)的consensus序列統(tǒng)計(jì)分析、可視化方法在審
| 申請?zhí)枺?/td> | 202110456786.8 | 申請日: | 2021-04-26 |
| 公開(公告)號: | CN113178231A | 公開(公告)日: | 2021-07-27 |
| 發(fā)明(設(shè)計(jì))人: | 司昊睿;周鵬 | 申請(專利權(quán))人: | 中國科學(xué)院武漢病毒研究所 |
| 主分類號: | G16B30/10 | 分類號: | G16B30/10;G16B45/00 |
| 代理公司: | 上海精晟知識產(chǎn)權(quán)代理有限公司 31253 | 代理人: | 馮子玲 |
| 地址: | 430000 湖北省武*** | 國省代碼: | 湖北;42 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 基于 二代 技術(shù) consensus 序列 統(tǒng)計(jì)分析 可視化 方法 | ||
本發(fā)明公開了一種基于二代測序技術(shù)的consensus序列統(tǒng)計(jì)分析、可視化方法,包括如下步驟:S1、獲取二代測序數(shù)據(jù)中的consensus序列;S2、對所述consensus序列進(jìn)行文件序列數(shù)的統(tǒng)計(jì),之后提取每條序列中每個位置的堿基并進(jìn)行分析判斷,找到每條序列中g(shù)aps和/或簡并堿基;S3、對每條序列中所述gaps和/或簡并堿基的類型、個數(shù)和位置進(jìn)行統(tǒng)計(jì),并獲取每條序列的長度;S4、分別計(jì)算所述每條序列的序列覆蓋度和所述gaps和/或簡并堿基位置的標(biāo)準(zhǔn)差,輸出結(jié)果,完成數(shù)據(jù)統(tǒng)計(jì)分析;通過對consensus序列中的gaps及簡并堿基的位置、數(shù)量、大小和分散程度進(jìn)行自動化統(tǒng)計(jì)分析,確定每條序列中的gaps及簡并堿基的具體信息,從而能更高效的剔除這些gaps和簡并堿基的片段,完成整個基因組的測序工作。
技術(shù)領(lǐng)域
本發(fā)明屬于二代測序技術(shù)領(lǐng)域,具體涉及一種基于二代測序技術(shù)的consensus序列統(tǒng)計(jì)分析、可視化方法。
背景技術(shù)
長期以來,測序技術(shù)一直是分子生物學(xué)相關(guān)研究中最常用的技術(shù)手段之一。基于測序技術(shù)的人類基因組計(jì)劃、轉(zhuǎn)錄組分析、微生物基因組重測序,單核苷酸多態(tài)性等方面的分析也同時促進(jìn)了生物學(xué)其他領(lǐng)域研究的進(jìn)步和發(fā)展。DNA測序技術(shù)的發(fā)展為人類探索自身和其他生命的奧秘提供了可能,同時,基因組學(xué)時代的來臨對DNA測序技術(shù)也提出了更高的要求,推動了DNA測序技術(shù)的不斷進(jìn)步。目前科學(xué)研究已經(jīng)進(jìn)入高通量測序時代,從單一、局部的基因或基因片段的研究轉(zhuǎn)變成了對整個基因組的研究,在基因組從頭測序和轉(zhuǎn)錄組測序中應(yīng)用較廣,繼第一代測序技術(shù)之后,隨著第二代、第三代測序技術(shù)的興起和發(fā)展,測序技術(shù)逐步朝著高通量、低成本、高安全性和商業(yè)化的方向發(fā)展。近幾年來,尤其是以單分子實(shí)時測序?yàn)榇淼牡谌鷾y序技術(shù)開始進(jìn)入人們的視野,該測序技術(shù)跨越了第一代、第二代較短讀長而直接對DNA單個分子進(jìn)行測序的新一代測序平臺應(yīng)用日益廣泛。
通過結(jié)合二代測序技術(shù)及下游生信分析來獲得微生物尤其是病毒的全長基因組序列已成為新物種發(fā)現(xiàn),進(jìn)化分析,溯源研究,流行病學(xué)調(diào)查等領(lǐng)域的常用方法。但是在低含量樣品中的微生物尤其是病毒全長基因組獲取時,常常伴隨有少量或者沒有二代測序reads覆蓋的區(qū)域(gaps)產(chǎn)生,造成無法直接通過二代測序及下游生信分析獲得全長基因組,需要結(jié)合一代Sanger測序的方法來驗(yàn)證和補(bǔ)充這些區(qū)域。當(dāng)進(jìn)行批量生物樣品的第二代測序分析時,會產(chǎn)生大量的consensus序列,同時伴隨著大量的gaps和簡并堿基,給后續(xù)一代測序的引物設(shè)計(jì)步驟帶來繁重的工作。
發(fā)明內(nèi)容
針對上述現(xiàn)有技術(shù)中存在的問題,本發(fā)明的目的是提供一種基于二代測序技術(shù)的consensus序列統(tǒng)計(jì)分析、可視化方法,解決當(dāng)前進(jìn)行批量生物樣品的第二代測序分析時,會產(chǎn)生大量的consensus序列,同時伴隨著大量的gaps和簡并堿基,給后續(xù)一代測序的引物設(shè)計(jì)步驟帶來繁重的工作等問題。
本發(fā)明的一個目的在于提供一種基于二代測序技術(shù)的consensus序列統(tǒng)計(jì)分析方法。
所述統(tǒng)計(jì)分析方法,包括如下步驟:
S1、獲取二代測序數(shù)據(jù)中的consensus序列;
S2、對所述consensus序列進(jìn)行文件序列數(shù)的統(tǒng)計(jì),之后提取每條序列中每個位置的堿基并進(jìn)行分析判斷,找到每條序列中g(shù)aps和/或簡并堿基;
S3、對每條序列中所述gaps和/或簡并堿基的類型、個數(shù)和位置進(jìn)行統(tǒng)計(jì),并獲取每條序列的長度;
S4、分別計(jì)算所述每條序列的序列覆蓋度和所述gaps和/或簡并堿基位置的標(biāo)準(zhǔn)差,輸出結(jié)果,完成數(shù)據(jù)統(tǒng)計(jì)分析。
通過對二代測序分析過程中產(chǎn)生的consensus序列中的gaps及簡并堿基的位置、數(shù)量、大小和分散程度進(jìn)行自動化統(tǒng)計(jì)分析,確定每條序列中的gaps及簡并堿基的具體信息,從而能更快、更高效的剔除這些gaps和簡并堿基的片段,完成整個基因組的測序工作。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國科學(xué)院武漢病毒研究所,未經(jīng)中國科學(xué)院武漢病毒研究所許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110456786.8/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 防止技術(shù)開啟的鎖具新技術(shù)
- 技術(shù)評價裝置、技術(shù)評價程序、技術(shù)評價方法
- 防止技術(shù)開啟的鎖具新技術(shù)
- 視聽模擬技術(shù)(VAS技術(shù))
- 用于技術(shù)縮放的MRAM集成技術(shù)
- 用于監(jiān)測技術(shù)設(shè)備的方法和用戶接口、以及計(jì)算機(jī)可讀存儲介質(zhì)
- 用于監(jiān)測技術(shù)設(shè)備的技術(shù)
- 技術(shù)偵查方法及技術(shù)偵查系統(tǒng)
- 使用投影技術(shù)增強(qiáng)睡眠技術(shù)
- 基于技術(shù)庫的技術(shù)推薦方法
- 一種利用RANSAC消除Brisk關(guān)鍵點(diǎn)錯誤匹配點(diǎn)對的方法
- 基于RANSAC的激光網(wǎng)格標(biāo)記圖像特征提取
- 一種基于凸松弛全局優(yōu)化算法的機(jī)器人手眼標(biāo)定方法
- 耐熱性提高的羰基還原酶突變體
- 一種基于相機(jī)軌跡估計(jì)和特征塊匹配的穩(wěn)像方法
- 一種單細(xì)胞免疫組庫測序數(shù)據(jù)的分析方法
- 一種基于凸松弛全局優(yōu)化算法的機(jī)器人手眼標(biāo)定方法
- 一種無參考基因組的群體變異檢測分析方法
- 一種基于二代測序技術(shù)的consensus序列統(tǒng)計(jì)分析、可視化方法
- 基于Consensus-ADMM優(yōu)化的可重構(gòu)純相位稀疏陣列綜合方法、裝置及介質(zhì)





