[發(fā)明專利]一種測(cè)定待測(cè)基因組區(qū)域表達(dá)水平的方法及系統(tǒng)有效
| 申請(qǐng)?zhí)枺?/td> | 201410096063.1 | 申請(qǐng)日: | 2014-03-14 |
| 公開(kāi)(公告)號(hào): | CN103984879B | 公開(kāi)(公告)日: | 2017-03-29 |
| 發(fā)明(設(shè)計(jì))人: | 楊力;朱閃閃;薛尉 | 申請(qǐng)(專利權(quán))人: | 中國(guó)科學(xué)院上海生命科學(xué)研究院 |
| 主分類號(hào): | G06F19/22 | 分類號(hào): | G06F19/22;G06F19/18 |
| 代理公司: | 上海一平知識(shí)產(chǎn)權(quán)代理有限公司31266 | 代理人: | 馬莉華,崔佳佳 |
| 地址: | 200031 *** | 國(guó)省代碼: | 上海;31 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | 一種 測(cè)定 基因組 區(qū)域 表達(dá) 水平 方法 系統(tǒng) | ||
1.一種測(cè)定待測(cè)基因組區(qū)域表達(dá)水平的方法,其特征在于,包括以下步驟:
(1)對(duì)待測(cè)樣本進(jìn)行測(cè)序,獲得包含待測(cè)基因組區(qū)域轉(zhuǎn)錄本的轉(zhuǎn)錄組測(cè)序數(shù)據(jù);
(2)將獲得的轉(zhuǎn)錄組測(cè)序數(shù)據(jù)與同一物種的基因組序列進(jìn)行比對(duì);
(3)對(duì)定位到基因組的轉(zhuǎn)錄組測(cè)序讀段進(jìn)行篩選,所述篩選包括去除測(cè)序質(zhì)量≤99.9%的轉(zhuǎn)錄組測(cè)序讀段;
(4)將篩選后的轉(zhuǎn)錄組測(cè)序讀段,按照其定位到基因組上的起始位置進(jìn)行排序,并對(duì)排序結(jié)果建立索引;
(5)根據(jù)待測(cè)基因組區(qū)域的位置信息,構(gòu)建出計(jì)算RPKM的基因注釋文件;
(6)計(jì)算能夠映射到基因組上的所有測(cè)序讀段的總數(shù)M;
(7)根據(jù)上述步驟(5)構(gòu)建的基因注釋文件計(jì)算出定位至待測(cè)DNA區(qū)間上所有測(cè)序讀段的總數(shù)R;
(8)根據(jù)上述步驟(5)構(gòu)建的基因注釋文件,計(jì)算出待測(cè)DNA區(qū)間所有被測(cè)序讀段定位的序列長(zhǎng)度L;和
(9)根據(jù)上述步驟(6)-(8)的計(jì)算結(jié)果,將步驟(7)得到的R除以步驟(6)得到的M與步驟(8)得到的L乘以109,得待測(cè)基因組區(qū)域的RPKM值,即為待測(cè)基因組區(qū)域的表達(dá)水平,計(jì)算公式如下,
2.如權(quán)利要求1所述的方法,其特征在于,所述方法還包括結(jié)果驗(yàn)證步驟,優(yōu)選地,所述結(jié)果驗(yàn)證步驟包括:提取待測(cè)樣品的總RNA,經(jīng)過(guò)反轉(zhuǎn)錄得到其cDNA,以cDNA作為模板進(jìn)行PCR檢測(cè),驗(yàn)證待測(cè)基因組區(qū)域的表達(dá)水平。
3.如權(quán)利要求1所述的方法,其特征在于,所述待測(cè)基因組區(qū)域包含N個(gè)同源異構(gòu)體,且N≥2。
4.如權(quán)利要求3所述的方法,其特征在于,在測(cè)定過(guò)程中還包括步驟:將各同源異構(gòu)體的所有外顯子進(jìn)行整合,對(duì)于重復(fù)的序列區(qū)間,僅保留單一序列,從而將同一待測(cè)基因組區(qū)域中的不同同源異構(gòu)體的外顯子整合成單一序列,將該單一序列的長(zhǎng)度作為計(jì)算該基因組區(qū)域表達(dá)水平時(shí)的序列長(zhǎng)度L。
5.如權(quán)利要求1所述的方法,其特征在于,所述步驟(1)中,所述轉(zhuǎn)錄組序列數(shù)據(jù)由羅氏454測(cè)序技術(shù)、Illumina測(cè)序技術(shù)、AB公司的SOLiD技術(shù)、或者第三代的單分子實(shí)時(shí)DNA測(cè)序技術(shù)獲得。
6.如權(quán)利要求1所述的方法,其特征在于,所述步驟(4)中,所述排序方法為:
a.按照每條測(cè)序讀段定位到基因組的起始位置進(jìn)行排序;
b.如果測(cè)序讀段在基因組位置中的起始位置相同,按照其定位到基因組的先后順序進(jìn)行排序,并且保留所有的測(cè)序讀段;
最后對(duì)排序結(jié)果建立索引。
7.如權(quán)利要求1所述的方法,其特征在于,所述基因組區(qū)域選自如下的組:癌基因基因組區(qū)域、遺傳疾病基因組區(qū)域和/或長(zhǎng)非編碼基因區(qū)域或任意指定的基因組區(qū)域。
該專利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專利權(quán)人授權(quán)。該專利全部權(quán)利屬于中國(guó)科學(xué)院上海生命科學(xué)研究院,未經(jīng)中國(guó)科學(xué)院上海生命科學(xué)研究院許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買此專利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410096063.1/1.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專利網(wǎng)。
- 上一篇:防水配電箱
- 下一篇:油缸行程調(diào)節(jié)裝置
- 同類專利
- 專利分類
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F19-00 專門適用于特定應(yīng)用的數(shù)字計(jì)算或數(shù)據(jù)處理的設(shè)備或方法
G06F19-10 .生物信息學(xué),即計(jì)算分子生物學(xué)中的遺傳或蛋白質(zhì)相關(guān)的數(shù)據(jù)處理方法或系統(tǒng)
G06F19-12 ..用于系統(tǒng)生物學(xué)的建模或仿真,例如:概率模型或動(dòng)態(tài)模型,遺傳基因管理網(wǎng)絡(luò),蛋白質(zhì)交互作用網(wǎng)絡(luò)或新陳代謝作用網(wǎng)絡(luò)
G06F19-14 ..用于發(fā)展或進(jìn)化的,例如:進(jìn)化的保存區(qū)域決定或進(jìn)化樹(shù)結(jié)構(gòu)
G06F19-16 ..用于分子結(jié)構(gòu)的,例如:結(jié)構(gòu)排序,結(jié)構(gòu)或功能關(guān)系,蛋白質(zhì)折疊,結(jié)構(gòu)域拓?fù)洌媒Y(jié)構(gòu)數(shù)據(jù)的藥靶,涉及二維或三維結(jié)構(gòu)的
G06F19-18 ..用于功能性基因組學(xué)或蛋白質(zhì)組學(xué)的,例如:基因型–表型關(guān)聯(lián),不均衡連接,種群遺傳學(xué),結(jié)合位置鑒定,變異發(fā)生,基因型或染色體組的注釋,蛋白質(zhì)相互作用或蛋白質(zhì)核酸的相互作用
- 減毒的人-牛嵌合呼吸道合胞病毒疫苗的生產(chǎn)
- 減毒的人-牛嵌合呼吸道合胞病毒疫苗的生產(chǎn)
- 用于對(duì)基因組進(jìn)行壓縮和解壓縮的方法和裝置
- 一種基因組重測(cè)序分析系統(tǒng)及方法
- 病原微生物基因組數(shù)據(jù)庫(kù)及其建立方法
- 宏基因組的重組裝方法、重組裝裝置及終端設(shè)備
- 用于保存和使用基因組及基因組數(shù)據(jù)的方法
- 識(shí)別胚胎中染色體異常的系統(tǒng)和方法
- 菌株基因組注釋查詢方法、裝置、電子設(shè)備及存儲(chǔ)介質(zhì)
- 真菌基因組測(cè)序數(shù)據(jù)自動(dòng)分析方法及系統(tǒng)
- RNAi轉(zhuǎn)染子的改良選擇方法
- 雙控雙調(diào)節(jié)原核表達(dá)載體系統(tǒng)及其構(gòu)建方法和用途
- 表達(dá)載體組織、新的生產(chǎn)用細(xì)胞產(chǎn)生方法及其在重組產(chǎn)生多肽中的用途
- 大腸桿菌表達(dá)系統(tǒng)表達(dá)人淀粉樣Aeta蛋白及純化的方法
- 一種智能表達(dá)式解析平臺(tái)及方法
- 一種復(fù)合表達(dá)式解析方法及系統(tǒng)
- 一種制備N-乙酰氨基半乳糖轉(zhuǎn)移酶的方法
- 定制生成表達(dá)式方法及裝置
- 文本的表達(dá)方法、裝置、電子設(shè)備及可讀存儲(chǔ)介質(zhì)
- 基因表達(dá)調(diào)節(jié)DNA,表達(dá)盒,表達(dá)載體





