[發(fā)明專利]一種Drop?seq數(shù)據(jù)質(zhì)量控制和分析方法在審
| 申請?zhí)枺?/td> | 201710638356.1 | 申請日: | 2017-07-31 |
| 公開(公告)號: | CN107463801A | 公開(公告)日: | 2017-12-12 |
| 發(fā)明(設(shè)計)人: | 張勇;張超;施威揚;王璐瑩 | 申請(專利權(quán))人: | 浙江紹興千尋生物科技有限公司 |
| 主分類號: | G06F19/24 | 分類號: | G06F19/24;G06F19/22 |
| 代理公司: | 紹興市越興專利事務(wù)所(普通合伙)33220 | 代理人: | 蔣衛(wèi)東 |
| 地址: | 312000 浙江省紹興市柯橋區(qū)柯橋經(jīng)*** | 國省代碼: | 浙江;33 |
| 權(quán)利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 drop seq 數(shù)據(jù) 質(zhì)量 控制 分析 方法 | ||
技術(shù)領(lǐng)域
本發(fā)明屬于生物學(xué)技術(shù)領(lǐng)域,特別涉及基于Drop-seq數(shù)據(jù)特征的生物信息分析技術(shù)領(lǐng)域,開展基于Drop-seq數(shù)據(jù)的質(zhì)量控制與數(shù)據(jù)分析流程的探究和開發(fā)。
背景技術(shù)
隨著第二代測序(Next-generation sequencing)技術(shù)的飛速發(fā)展,逐步增長的通量和逐年降低的測序成本使得人們利用測序技術(shù)對轉(zhuǎn)錄組學(xué)與表觀遺傳組學(xué)的研究逐漸深入,并開發(fā)了一系列定量研究手段如用于檢測特定條件下各基因的表達水平的轉(zhuǎn)錄組測序技術(shù)(RNA-seq)以及定性研究手段如用于觀測DNA與轉(zhuǎn)錄因子蛋白相互作用的染色質(zhì)免疫共沉淀技術(shù)(ChIP-seq)。隨著第二代測序的通量和分辨率不斷提高,一些其它方面的問題也逐漸出現(xiàn),為了解決細(xì)胞異質(zhì)性以及稀有細(xì)胞無法檢測的問題,近年來開發(fā)了基于單細(xì)胞的測序技術(shù)。scRNA-seq技術(shù),可以獲得單個細(xì)胞的全基因組表達譜,從而使scRNA-seq技術(shù)成為同時研究上千個細(xì)胞之間的表達差異的的工具。伴隨著scRNA-seq技術(shù)飛速的發(fā)展,與此同時其數(shù)據(jù)分析的方法也越來越成熟。單細(xì)胞測序數(shù)據(jù)分析的生物信息學(xué)方法也與傳統(tǒng)的多細(xì)胞測序數(shù)據(jù)的分析方法有著較大的差別。單細(xì)胞測序數(shù)據(jù)由于其細(xì)胞用量少的原因使得測序中會丟失大量的序列片段。與基于多細(xì)胞的第二代測序方法相比,單細(xì)胞測序數(shù)據(jù)具有零值多,精度低等特點,為第二代測序所開發(fā)的眾多生物信息學(xué)算法以及工具都需要進一步的考量與改進,甚至是重新開發(fā)以適應(yīng)單細(xì)胞測序數(shù)據(jù)。
獲得單個細(xì)胞之間的轉(zhuǎn)錄本的差異,是了解復(fù)雜組織和功能響應(yīng)的一個重要方法,但是由于單細(xì)胞測序?qū)τ谕瑫r進行多個單細(xì)胞的文庫制備所花費的時間和成本的限制,以及單細(xì)胞測序數(shù)據(jù)分析算法的缺少,限制了人們的研究。而基于液滴微流控技術(shù)的轉(zhuǎn)錄組測序方法(Drop-seq)可以在一次實驗中得到大批量的單個細(xì)胞的基因表達譜數(shù)據(jù),有效的彌補了傳統(tǒng)單細(xì)胞測序技術(shù)的不足。Drop-seq是通過把細(xì)胞封裝在微小液滴中進行成千上萬個單細(xì)胞的mRNA并行測序,Drop-seq技術(shù)的優(yōu)勢使其可以在廣泛的領(lǐng)域中使用。例如,全基因組范圍的遺傳學(xué)研究主要目的是確定哪些基因的改變會對疾病的風(fēng)險有影響,但是目前生物學(xué)上還缺乏類似把這些基因關(guān)聯(lián)到特定疾病和某一功能響應(yīng)上的高通量方法,Drop-seq技術(shù)可以用來探索這些基因是如何作用在各個組織的不同類型細(xì)胞的機制。另外,Drop-seq可以得到突變體、病原體或者其它刺激源的擾動信息,進而獲得其在許多細(xì)胞類型上的包含擾動影響的一個信息豐富、多維的測序結(jié)果。基于液滴微流控分選細(xì)胞技術(shù)還可以與其它的表觀遺傳組學(xué)研究手段相結(jié)合從而實現(xiàn)了大批量的單細(xì)胞表觀遺傳組測序技術(shù)。
隨著細(xì)胞分選技術(shù)的發(fā)展(例如液滴微流控技術(shù)),大批量單細(xì)胞測序技術(shù)(例如Drop-seq)將會越來越多,隨之意外的、深遠(yuǎn)的發(fā)現(xiàn)將在短時期內(nèi)大量涌現(xiàn)出來,包括對新的細(xì)胞亞型的鑒定,識別基因表達模式來預(yù)測細(xì)胞的狀態(tài)以及研究隨機轉(zhuǎn)錄對功能的影響。但是這些結(jié)論都是建立在穩(wěn)定的計算方法的基礎(chǔ)上。這些技術(shù)目前普遍存在目標(biāo)片段的捕獲率低、轉(zhuǎn)換效率低以及測序深度低的問題,使得測序結(jié)果不足以覆蓋每個細(xì)胞中的大部分信息,并且相比多細(xì)胞測序和傳統(tǒng)單細(xì)胞測序增加了測序的噪音水平。因此,大批量單細(xì)胞測序數(shù)據(jù)的好壞與否對于下游分析和研究有極大的影響。質(zhì)量控制應(yīng)該是在分析流程中的第一步驟,以確保數(shù)據(jù)的質(zhì)量,并為隨后的分析提供一個堅實基礎(chǔ)。目前尚無針對Drop-seq數(shù)據(jù)的質(zhì)量控制算法,Drop-seq數(shù)據(jù)的低mRNA捕獲率、超高維、低精度的特征,開發(fā)質(zhì)量控制流程是極其必要的,針對Drop-seq這樣一個全新的技術(shù)手段及獨特的數(shù)據(jù)特點,開發(fā)生物信息學(xué)質(zhì)量控制和分析方法也迫在眉睫。
發(fā)明內(nèi)容
本發(fā)明的目的開發(fā)針對基于液滴微流控技術(shù)的轉(zhuǎn)錄組測序數(shù)據(jù)的質(zhì)量控制體系確,保數(shù)據(jù)可信度。
為達到上述目的,本發(fā)明的具體技術(shù)方案為:
一種Drop-seq數(shù)據(jù)質(zhì)量控制和分析方法,該方法包括以下步驟:
第一步、使用兩個配對的測序文件作為輸入文件,其中一個文件包含轉(zhuǎn)錄本的信息,另一個文件包含細(xì)胞條形碼和UMI的信息。即Drop-seq數(shù)據(jù)的結(jié)構(gòu)由細(xì)胞條形碼、UMI和cDNA三部分組成。其中細(xì)胞條形碼是用來標(biāo)識不同的細(xì)胞,由12個堿基組成;UMI,由8個堿基組成,用來識別同一個細(xì)胞中不同的cDNA。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于浙江紹興千尋生物科技有限公司,未經(jīng)浙江紹興千尋生物科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201710638356.1/2.html,轉(zhuǎn)載請聲明來源鉆瓜專利網(wǎng)。
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F19-00 專門適用于特定應(yīng)用的數(shù)字計算或數(shù)據(jù)處理的設(shè)備或方法
G06F19-10 .生物信息學(xué),即計算分子生物學(xué)中的遺傳或蛋白質(zhì)相關(guān)的數(shù)據(jù)處理方法或系統(tǒng)
G06F19-12 ..用于系統(tǒng)生物學(xué)的建模或仿真,例如:概率模型或動態(tài)模型,遺傳基因管理網(wǎng)絡(luò),蛋白質(zhì)交互作用網(wǎng)絡(luò)或新陳代謝作用網(wǎng)絡(luò)
G06F19-14 ..用于發(fā)展或進化的,例如:進化的保存區(qū)域決定或進化樹結(jié)構(gòu)
G06F19-16 ..用于分子結(jié)構(gòu)的,例如:結(jié)構(gòu)排序,結(jié)構(gòu)或功能關(guān)系,蛋白質(zhì)折疊,結(jié)構(gòu)域拓?fù)洌媒Y(jié)構(gòu)數(shù)據(jù)的藥靶,涉及二維或三維結(jié)構(gòu)的
G06F19-18 ..用于功能性基因組學(xué)或蛋白質(zhì)組學(xué)的,例如:基因型–表型關(guān)聯(lián),不均衡連接,種群遺傳學(xué),結(jié)合位置鑒定,變異發(fā)生,基因型或染色體組的注釋,蛋白質(zhì)相互作用或蛋白質(zhì)核酸的相互作用
- 基于多層Bi-GRU的Seq2seq網(wǎng)絡(luò)短期電力負(fù)荷預(yù)測方法
- 一種基于seq2seq模型的中文分詞方法
- 基于seq2seq深度神經(jīng)網(wǎng)絡(luò)模型的關(guān)鍵詞抽取方法
- 一種基于seq2seq+attention的中文文本糾錯方法
- 基于seq2seq動態(tài)特征提取模型的制漿能耗預(yù)測方法
- 一種基于seq2seq框架的基站標(biāo)號軌跡預(yù)測方法
- 一種Seq2Seq模型訓(xùn)練方法、裝置、介質(zhì)和設(shè)備
- 基于seq2seq的數(shù)據(jù)中心能效優(yōu)化連續(xù)決策方法
- 基于TPA-Seq2Seq的電力負(fù)荷預(yù)測方法及相關(guān)組件
- 基于Seq2seq模型的摘要生成方法
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法、數(shù)據(jù)系統(tǒng)、接收設(shè)備和數(shù)據(jù)讀取方法
- 數(shù)據(jù)記錄方法、數(shù)據(jù)記錄裝置、數(shù)據(jù)記錄媒體、數(shù)據(jù)重播方法和數(shù)據(jù)重播裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)發(fā)送系統(tǒng)、數(shù)據(jù)發(fā)送裝置以及數(shù)據(jù)結(jié)構(gòu)
- 數(shù)據(jù)顯示系統(tǒng)、數(shù)據(jù)中繼設(shè)備、數(shù)據(jù)中繼方法及數(shù)據(jù)系統(tǒng)
- 數(shù)據(jù)嵌入裝置、數(shù)據(jù)嵌入方法、數(shù)據(jù)提取裝置及數(shù)據(jù)提取方法
- 數(shù)據(jù)管理裝置、數(shù)據(jù)編輯裝置、數(shù)據(jù)閱覽裝置、數(shù)據(jù)管理方法、數(shù)據(jù)編輯方法以及數(shù)據(jù)閱覽方法
- 數(shù)據(jù)發(fā)送和數(shù)據(jù)接收設(shè)備、數(shù)據(jù)發(fā)送和數(shù)據(jù)接收方法
- 數(shù)據(jù)發(fā)送裝置、數(shù)據(jù)接收裝置、數(shù)據(jù)收發(fā)系統(tǒng)、數(shù)據(jù)發(fā)送方法、數(shù)據(jù)接收方法和數(shù)據(jù)收發(fā)方法
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置
- 數(shù)據(jù)發(fā)送方法、數(shù)據(jù)再現(xiàn)方法、數(shù)據(jù)發(fā)送裝置及數(shù)據(jù)再現(xiàn)裝置





