[發(fā)明專(zhuān)利]RNA測(cè)序數(shù)據(jù)處理的方法和裝置在審
| 申請(qǐng)?zhí)枺?/td> | 201410724856.3 | 申請(qǐng)日: | 2015-08-04 |
| 公開(kāi)(公告)號(hào): | CN104504302A | 公開(kāi)(公告)日: | 2015-07-29 |
| 發(fā)明(設(shè)計(jì))人: | 陳利群;姜曉雪;郭陽(yáng);周婷婷 | 申請(qǐng)(專(zhuān)利權(quán))人: | 北京諾禾致源生物信息科技有限公司 |
| 主分類(lèi)號(hào): | G06F19/20 | 分類(lèi)號(hào): | G06F19/20;G06F17/30 |
| 代理公司: | 北京康信知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 11240 | 代理人: | 吳貴明;張永明 |
| 地址: | 102206 北京市昌平區(qū)*** | 國(guó)省代碼: | 北京;11 |
| 權(quán)利要求書(shū): | 查看更多 | 說(shuō)明書(shū): | 查看更多 |
| 摘要: | |||
| 搜索關(guān)鍵詞: | rna 序數(shù) 處理 方法 裝置 | ||
技術(shù)領(lǐng)域
本發(fā)明涉及測(cè)序數(shù)據(jù)處理領(lǐng)域,具體而言,涉及一種RNA測(cè)序數(shù)據(jù)的處理方法和裝置。
背景技術(shù)
由于高通量測(cè)序技術(shù)具有通量高、成本低、數(shù)據(jù)信息量大的優(yōu)點(diǎn),越來(lái)越多的生物學(xué)研究人員選擇采用高通量測(cè)序的方法作為一種研究的手段。然而,測(cè)序所得的數(shù)據(jù)是海量的,各大測(cè)序公司紛紛推出各種處理方法供用戶(hù)選擇,但現(xiàn)有技術(shù)中的測(cè)序數(shù)據(jù)的處理方法存在處理效率低下(只能針對(duì)單一樣本進(jìn)行分析)、輸出結(jié)果單一、無(wú)法進(jìn)行多樣化分析的缺陷。
因此,急需建立一種能夠?qū)y(cè)序數(shù)據(jù)進(jìn)行多樣化分析的方法,以提供更準(zhǔn)確、更全面的分析結(jié)果。
發(fā)明內(nèi)容
本發(fā)明旨在提供一種RNA測(cè)序數(shù)據(jù)的處理方法和裝置,以改善現(xiàn)有的處理方法所得結(jié)果單一、信息不全等缺陷。
為了實(shí)現(xiàn)上述目的,根據(jù)本發(fā)明的一個(gè)方面,提供了一種RNA測(cè)序數(shù)據(jù)的處理方法,方法包括:獲取RNA測(cè)序數(shù)據(jù)的文件路徑;根據(jù)RNA測(cè)序數(shù)據(jù)的文件路徑獲取包含RNA測(cè)序數(shù)據(jù)的測(cè)序數(shù)據(jù)文件;獲取用于對(duì)測(cè)序數(shù)據(jù)文件進(jìn)行篩選處理的查詢(xún)條件,查詢(xún)條件至少包括如下任意一種或多種條件:包含至少一個(gè)基因名稱(chēng)的基因名稱(chēng)列表以及至少一個(gè)樣本的基因信息標(biāo)簽;根據(jù)查詢(xún)條件從測(cè)序數(shù)據(jù)文件中查詢(xún)得到RNA測(cè)序數(shù)據(jù)中滿(mǎn)足查詢(xún)條件的篩選結(jié)果;輸出RNA測(cè)序數(shù)據(jù)中滿(mǎn)足查詢(xún)條件的篩選結(jié)果。
進(jìn)一步地,通過(guò)如下任意一種方式獲取用于對(duì)測(cè)序數(shù)據(jù)文件進(jìn)行篩選處理的查詢(xún)條件中的基因名稱(chēng)列表:方式一:通過(guò)應(yīng)用界面提供的輸入框接收用戶(hù)輸入的基因名稱(chēng)列表;方式二:確定基因名稱(chēng)列表對(duì)應(yīng)的列表保存地址,根據(jù)列表保存地址讀取并導(dǎo)入基因名稱(chēng)列表;方式三:根據(jù)預(yù)先確定的基因名稱(chēng)的篩選條件,從測(cè)序數(shù)據(jù)文件中篩選得到基因名稱(chēng)列表,其中,基因名稱(chēng)的篩選條件包括如下任意一個(gè)或多個(gè)信息:樣品表達(dá)量、差異比較組以及基因功能。
進(jìn)一步地,在通過(guò)方式三獲取用于對(duì)測(cè)序數(shù)據(jù)文件進(jìn)行篩選處理的查詢(xún)條件中的基因名稱(chēng)列表的情況下:當(dāng)基因名稱(chēng)的篩選條件至少包括樣品表達(dá)量時(shí),根據(jù)預(yù)先確定的基因名稱(chēng)的篩選條件,從測(cè)序數(shù)據(jù)文件中篩選得到基因名稱(chēng)列表的步驟包括:獲取用戶(hù)輸入樣品的RPKM閾值或FPKM閾值,根據(jù)樣品的RPKM閾值或FPKM閾值,從測(cè)序數(shù)據(jù)文件中篩選得到滿(mǎn)足樣品的RPKM閾值或FPKM閾值的基因名稱(chēng)列表。
進(jìn)一步地,在通過(guò)方式三獲取用于對(duì)測(cè)序數(shù)據(jù)文件進(jìn)行篩選處理的查詢(xún)條件中的基因名稱(chēng)列表的情況下:當(dāng)基因名稱(chēng)的篩選條件至少包括差異比較組時(shí),根據(jù)預(yù)先確定的基因名稱(chēng)的篩選條件,從測(cè)序數(shù)據(jù)文件中篩選得到基因名稱(chēng)列表的步驟包括:獲取用戶(hù)輸入的比較樣品組的log2fold?change閾值和q值閾值,根據(jù)比較樣品組的log2fold?change閾值和q值閾值,從測(cè)序數(shù)據(jù)文件中篩選得到滿(mǎn)足比較樣品組的log2fold?change閾值和q值閾值的基因名稱(chēng)列表。
進(jìn)一步地,在通過(guò)方式三獲取用于對(duì)測(cè)序數(shù)據(jù)文件進(jìn)行篩選處理的查詢(xún)條件中的基因名稱(chēng)列表的情況下:當(dāng)基因名稱(chēng)的篩選條件至少包括基因功能時(shí),根據(jù)預(yù)先確定的基因名稱(chēng)的篩選條件,從測(cè)序數(shù)據(jù)文件中篩選得到基因名稱(chēng)列表的步驟包括:獲取用戶(hù)輸入包括如下任意一個(gè)或多個(gè)基因功能信息:GO?ID號(hào)、GO注釋庫(kù)中的關(guān)鍵詞、KEGG?ID號(hào)以及KEGG注釋庫(kù)中的關(guān)鍵詞;根據(jù)一個(gè)或多個(gè)功能信息,從測(cè)序數(shù)據(jù)文件中篩選得到滿(mǎn)足一個(gè)或多個(gè)基因功能信息的基因名稱(chēng)列表。
進(jìn)一步地,在獲取到用于對(duì)測(cè)序數(shù)據(jù)文件進(jìn)行篩選處理的查詢(xún)條件中的基因名稱(chēng)列表之后,方法還包括:根據(jù)用戶(hù)輸入的提取基因的基因信息標(biāo)簽,獲取測(cè)序數(shù)據(jù)文件中符合基因名稱(chēng)列表中的基因的基因信息標(biāo)簽;其中,基因信息標(biāo)簽包括基因功能注釋、基因表達(dá)量、基因分子標(biāo)記、基因序列、基因差異分析和基因富集。
進(jìn)一步地,在基因信息標(biāo)簽為基因功能注釋的情況下,在獲取到用于對(duì)測(cè)序數(shù)據(jù)文件進(jìn)行篩選處理的查詢(xún)條件中的基因名稱(chēng)列表之后,方法還包括:獲取用戶(hù)輸入的用于提取基因的如下任意一種或多種基因功能注釋?zhuān)夯蜷L(zhǎng)度、NR、NT、KEGG、Swissprot、PFAM和GO的功能注釋?zhuān)桓鶕?jù)基因名稱(chēng)列表和一種或多種基因功能注釋?zhuān)瑥臏y(cè)序數(shù)據(jù)文件中查詢(xún)得到滿(mǎn)足基因名稱(chēng)列表和基因功能注釋的篩選結(jié)果。
該專(zhuān)利技術(shù)資料僅供研究查看技術(shù)是否侵權(quán)等信息,商用須獲得專(zhuān)利權(quán)人授權(quán)。該專(zhuān)利全部權(quán)利屬于北京諾禾致源生物信息科技有限公司,未經(jīng)北京諾禾致源生物信息科技有限公司許可,擅自商用是侵權(quán)行為。如果您想購(gòu)買(mǎi)此專(zhuān)利、獲得商業(yè)授權(quán)和技術(shù)合作,請(qǐng)聯(lián)系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201410724856.3/2.html,轉(zhuǎn)載請(qǐng)聲明來(lái)源鉆瓜專(zhuān)利網(wǎng)。
- 同類(lèi)專(zhuān)利
- 專(zhuān)利分類(lèi)
G06F 電數(shù)字?jǐn)?shù)據(jù)處理
G06F19-00 專(zhuān)門(mén)適用于特定應(yīng)用的數(shù)字計(jì)算或數(shù)據(jù)處理的設(shè)備或方法
G06F19-10 .生物信息學(xué),即計(jì)算分子生物學(xué)中的遺傳或蛋白質(zhì)相關(guān)的數(shù)據(jù)處理方法或系統(tǒng)
G06F19-12 ..用于系統(tǒng)生物學(xué)的建模或仿真,例如:概率模型或動(dòng)態(tài)模型,遺傳基因管理網(wǎng)絡(luò),蛋白質(zhì)交互作用網(wǎng)絡(luò)或新陳代謝作用網(wǎng)絡(luò)
G06F19-14 ..用于發(fā)展或進(jìn)化的,例如:進(jìn)化的保存區(qū)域決定或進(jìn)化樹(shù)結(jié)構(gòu)
G06F19-16 ..用于分子結(jié)構(gòu)的,例如:結(jié)構(gòu)排序,結(jié)構(gòu)或功能關(guān)系,蛋白質(zhì)折疊,結(jié)構(gòu)域拓?fù)洌媒Y(jié)構(gòu)數(shù)據(jù)的藥靶,涉及二維或三維結(jié)構(gòu)的
G06F19-18 ..用于功能性基因組學(xué)或蛋白質(zhì)組學(xué)的,例如:基因型–表型關(guān)聯(lián),不均衡連接,種群遺傳學(xué),結(jié)合位置鑒定,變異發(fā)生,基因型或染色體組的注釋?zhuān)鞍踪|(zhì)相互作用或蛋白質(zhì)核酸的相互作用
- 用于治療RNA依賴(lài)性RNA病毒感染的核苷氨基磷酸芳基酯
- 人黑色素瘤細(xì)胞相關(guān)的長(zhǎng)非編碼RNA的RNA干擾靶點(diǎn)RNA及用途
- 無(wú)DNA殘留的RNA提取試劑盒及RNA提取方法
- 一種用于非疾病診斷目的的定量檢測(cè)內(nèi)源環(huán)狀RNA的方法
- 一種監(jiān)控總RNA中線狀RNA消除的方法
- 一種利用常規(guī)試劑提取RNA的方法
- 基于雙分子熒光互補(bǔ)的新型信使RNA和環(huán)狀RNA標(biāo)記方法
- 一種通用快速DNA產(chǎn)品中RNA殘留定量方法
- 一種去除高豐度RNA的測(cè)序文庫(kù)及其構(gòu)建方法
- 一種G4型歐亞類(lèi)禽H1N1豬流感病毒滅活疫苗的制備
- 序數(shù)鐘表
- 一種時(shí)序數(shù)據(jù)的處理方法及裝置
- 一種FPGA程序數(shù)據(jù)的加載方法及裝置
- 一種時(shí)序數(shù)據(jù)流分割方法、裝置及其存儲(chǔ)介質(zhì)
- 一種工業(yè)時(shí)序數(shù)據(jù)的訪問(wèn)方法及系統(tǒng)
- 一種時(shí)序數(shù)據(jù)的平滑處理方法和裝置
- 時(shí)序數(shù)據(jù)多層次語(yǔ)義裁剪方法、裝置、電子設(shè)備及介質(zhì)
- 一種數(shù)據(jù)存儲(chǔ)方法、裝置、服務(wù)器及存儲(chǔ)介質(zhì)
- 一種時(shí)序數(shù)據(jù)異常檢測(cè)方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)
- 一種基因測(cè)序數(shù)據(jù)排序方法、集成電路及排序設(shè)備
- 一種數(shù)據(jù)庫(kù)讀寫(xiě)分離的方法和裝置
- 一種手機(jī)動(dòng)漫人物及背景創(chuàng)作方法
- 一種通訊綜合測(cè)試終端的測(cè)試方法
- 一種服裝用人體測(cè)量基準(zhǔn)點(diǎn)的獲取方法
- 系統(tǒng)升級(jí)方法及裝置
- 用于虛擬和接口方法調(diào)用的裝置和方法
- 線程狀態(tài)監(jiān)控方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)
- 一種JAVA智能卡及其虛擬機(jī)組件優(yōu)化方法
- 檢測(cè)程序中方法耗時(shí)的方法、裝置及存儲(chǔ)介質(zhì)
- 函數(shù)的執(zhí)行方法、裝置、設(shè)備及存儲(chǔ)介質(zhì)





