[發(fā)明專利]一種基于二代測序技術(shù)的consensus序列統(tǒng)計(jì)分析、可視化方法在審

申請?zhí)枺?/td>	202110456786.8	申請日：	2021-04-26
公開（公告）號：	CN113178231A	公開（公告）日：	2021-07-27
發(fā)明（設(shè)計(jì)）人：	司昊睿;周鵬	申請（專利權(quán)）人：	中國科學(xué)院武漢病毒研究所
主分類號：	G16B30/10	分類號：	G16B30/10;G16B45/00
代理公司：	上海精晟知識產(chǎn)權(quán)代理有限公司 31253	代理人：	馮子玲
地址：	430000 湖北省武***	國省代碼：	湖北;42
權(quán)利要求書：	查看更多	說明書：	查看更多
摘要：
搜索關(guān)鍵詞：	一種基于二代技術(shù) consensus 序列統(tǒng)計(jì)分析可視化方法
鉆瓜網(wǎng) 技術(shù)展會專利詞庫專利權(quán)人專利榜在售專利公布日期熱門專利

【說明書】：

本發(fā)明公開了一種基于二代測序技術(shù)的consensus序列統(tǒng)計(jì)分析、可視化方法，包括如下步驟：S1、獲取二代測序數(shù)據(jù)中的consensus序列；S2、對所述consensus序列進(jìn)行文件序列數(shù)的統(tǒng)計(jì)，之后提取每條序列中每個位置的堿基并進(jìn)行分析判斷，找到每條序列中g(shù)aps和/或簡并堿基；S3、對每條序列中所述gaps和/或簡并堿基的類型、個數(shù)和位置進(jìn)行統(tǒng)計(jì)，并獲取每條序列的長度；S4、分別計(jì)算所述每條序列的序列覆蓋度和所述gaps和/或簡并堿基位置的標(biāo)準(zhǔn)差，輸出結(jié)果，完成數(shù)據(jù)統(tǒng)計(jì)分析；通過對consensus序列中的gaps及簡并堿基的位置、數(shù)量、大小和分散程度進(jìn)行自動化統(tǒng)計(jì)分析，確定每條序列中的gaps及簡并堿基的具體信息，從而能更高效的剔除這些gaps和簡并堿基的片段，完成整個基因組的測序工作。

技術(shù)領(lǐng)域

本發(fā)明屬于二代測序技術(shù)領(lǐng)域，具體涉及一種基于二代測序技術(shù)的consensus序列統(tǒng)計(jì)分析、可視化方法。

背景技術(shù)

長期以來，測序技術(shù)一直是分子生物學(xué)相關(guān)研究中最常用的技術(shù)手段之一。基于測序技術(shù)的人類基因組計(jì)劃、轉(zhuǎn)錄組分析、微生物基因組重測序，單核苷酸多態(tài)性等方面的分析也同時促進(jìn)了生物學(xué)其他領(lǐng)域研究的進(jìn)步和發(fā)展。DNA測序技術(shù)的發(fā)展為人類探索自身和其他生命的奧秘提供了可能，同時，基因組學(xué)時代的來臨對DNA測序技術(shù)也提出了更高的要求，推動了DNA測序技術(shù)的不斷進(jìn)步。目前科學(xué)研究已經(jīng)進(jìn)入高通量測序時代，從單一、局部的基因或基因片段的研究轉(zhuǎn)變成了對整個基因組的研究，在基因組從頭測序和轉(zhuǎn)錄組測序中應(yīng)用較廣，繼第一代測序技術(shù)之后，隨著第二代、第三代測序技術(shù)的興起和發(fā)展，測序技術(shù)逐步朝著高通量、低成本、高安全性和商業(yè)化的方向發(fā)展。近幾年來，尤其是以單分子實(shí)時測序?yàn)榇淼牡谌鷾y序技術(shù)開始進(jìn)入人們的視野，該測序技術(shù)跨越了第一代、第二代較短讀長而直接對DNA單個分子進(jìn)行測序的新一代測序平臺應(yīng)用日益廣泛。

通過結(jié)合二代測序技術(shù)及下游生信分析來獲得微生物尤其是病毒的全長基因組序列已成為新物種發(fā)現(xiàn)，進(jìn)化分析，溯源研究，流行病學(xué)調(diào)查等領(lǐng)域的常用方法。但是在低含量樣品中的微生物尤其是病毒全長基因組獲取時，常常伴隨有少量或者沒有二代測序reads覆蓋的區(qū)域(gaps)產(chǎn)生，造成無法直接通過二代測序及下游生信分析獲得全長基因組，需要結(jié)合一代Sanger測序的方法來驗(yàn)證和補(bǔ)充這些區(qū)域。當(dāng)進(jìn)行批量生物樣品的第二代測序分析時，會產(chǎn)生大量的consensus序列，同時伴隨著大量的gaps和簡并堿基，給后續(xù)一代測序的引物設(shè)計(jì)步驟帶來繁重的工作。

發(fā)明內(nèi)容

針對上述現(xiàn)有技術(shù)中存在的問題，本發(fā)明的目的是提供一種基于二代測序技術(shù)的consensus序列統(tǒng)計(jì)分析、可視化方法，解決當(dāng)前進(jìn)行批量生物樣品的第二代測序分析時，會產(chǎn)生大量的consensus序列，同時伴隨著大量的gaps和簡并堿基，給后續(xù)一代測序的引物設(shè)計(jì)步驟帶來繁重的工作等問題。

本發(fā)明的一個目的在于提供一種基于二代測序技術(shù)的consensus序列統(tǒng)計(jì)分析方法。

所述統(tǒng)計(jì)分析方法，包括如下步驟：

S1、獲取二代測序數(shù)據(jù)中的consensus序列；

S2、對所述consensus序列進(jìn)行文件序列數(shù)的統(tǒng)計(jì)，之后提取每條序列中每個位置的堿基并進(jìn)行分析判斷，找到每條序列中g(shù)aps和/或簡并堿基；

S3、對每條序列中所述gaps和/或簡并堿基的類型、個數(shù)和位置進(jìn)行統(tǒng)計(jì)，并獲取每條序列的長度；

S4、分別計(jì)算所述每條序列的序列覆蓋度和所述gaps和/或簡并堿基位置的標(biāo)準(zhǔn)差，輸出結(jié)果，完成數(shù)據(jù)統(tǒng)計(jì)分析。

通過對二代測序分析過程中產(chǎn)生的consensus序列中的gaps及簡并堿基的位置、數(shù)量、大小和分散程度進(jìn)行自動化統(tǒng)計(jì)分析，確定每條序列中的gaps及簡并堿基的具體信息，從而能更快、更高效的剔除這些gaps和簡并堿基的片段，完成整個基因組的測序工作。

下載完整專利技術(shù)內(nèi)容需要扣除積分，VIP會員可以免費(fèi)下載。

免登錄下載普通用戶下載升級VIP會員，免費(fèi)下載

該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息，商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國科學(xué)院武漢病毒研究所，未經(jīng)中國科學(xué)院武漢病毒研究所許可，擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作，請聯(lián)系【客服】

本文鏈接：http://www.szxzyx.cn/pat/books/202110456786.8/2.html，轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。

上一篇：一種活塞銷
下一篇：螺旋纏繞光纖的DAS六分量地震信號解耦與恢復(fù)方法

同類專利

專利分類

G 物理

免登錄下載普通用戶下載升級VIP會員，免費(fèi)下載

專利文獻(xiàn)下載

說明：

1、專利原文基于中國國家知識產(chǎn)權(quán)局專利說明書；

2、支持發(fā)明專利、實(shí)用新型專利、外觀設(shè)計(jì)專利（升級中）；

3、專利數(shù)據(jù)每周兩次同步更新，支持Adobe PDF格式；

4、內(nèi)容包括專利技術(shù)的結(jié)構(gòu)示意圖、流程工藝圖或技術(shù)構(gòu)造圖；

5、已全新升級為極速版,下載速度顯著提升！歡迎使用！

請您登陸后，進(jìn)行下載，點(diǎn)擊【登陸】【注冊】