[發明專利]一種小RNA測序數據表達量計算方法在審
| 申請號: | 201711439911.4 | 申請日: | 2017-12-26 |
| 公開(公告)號: | CN108154009A | 公開(公告)日: | 2018-06-12 |
| 發明(設計)人: | 李婷 | 申請(專利權)人: | 重慶佰諾吉生物科技有限公司 |
| 主分類號: | G06F19/20 | 分類號: | G06F19/20 |
| 代理公司: | 重慶圖為知識產權代理事務所(普通合伙) 50233 | 代理人: | 蔣國榮 |
| 地址: | 400000 重慶市九龍坡*** | 國省代碼: | 重慶;50 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 表達量 測序數據 序列提取 有效序列 小RNA 質量控制 接頭處理 有效處理 原始數據 去除 樣本 統計 | ||
本發明公開了一種小RNA測序數據表達量計算方法,包括:獲取原始測序數據,對所述獲得的原始數據進行質量控制序列提取,對所述質量控制序列提取后的數據進行去除接頭處理,對所述除接頭后的數據進行有效序列提取,對所述提取的有效序列有效處理,統計不同序列在不同樣本中的表達量。該方法能準確快速的計算RNA測序數據的表達量。
技術領域
本發明涉及一種基因測試領域,特別涉及一種RNA測序數據表達量計算方法。
背景技術
小RNA(small RNAs)主要指長度在18-30nt的一類非編碼RNA(ncRNAs),在真核生物中,具有基因表達調控功能的小RNA主要有微小RNA(microRNAs)、內源小干擾RNA(endo-siRNAs)和piwi干擾RNA(piRNAs)。piRNA長度集中在26-31nt,目前只在動物的生殖系細胞及干細胞中被發現,其主要功能是參與轉座子的沉默。
miRNAs和endo-siRNAs長度主要集中在20-24nt。miRNAs在動植物和微生物中都普遍存在,目前在miRBase 21數據庫中已包含223個物種的35828條記錄。在細胞質中,miRNAs與AGO1等蛋白形成RISC復合體(RNA-induced silencing complex),RISC通過miRNA與特定的mRNA靶基因互補配對,在配對區域的中間位置,AGO1通過對mRNA的切割促使其降解或者通過翻譯抑制實現轉錄后調控。據估計一個物種中約1/3的基因會受到miRNA的調控,大量的實驗也表明miRNAs參與了諸多生命過程的調控,例如細胞周期,細胞分化,組織器官的發生,營養代謝,信號途徑以及對外界生物的非生物的環境的反應;同時,miRNAs在生產實踐與臨床治療上也具有很大的應用前景。
小分子干擾RNA(siRNAs)最初在植物轉錄后基因沉默現象中被報道,長度在20-25nt,來自外源的雙鏈核糖核酸(dsRNA)切割產生。隨著小RNA研究的深入發展,大量的endo-siRNAs被發現,在植物體內,endo-siRNAs目前可以分為三種類型:
(1)trans-acting siRNAs(ta-siRNAs),21nt,功能與miRNAs類似,與AGO1或AGO7組成RISC復合體參與轉錄后調控。
(2)Natural-antisense siRNAs(nat-siRNAs),21nt和24nt,21nt的nat-siRNAs功能與miRNAs類似,參與轉錄后調控。
(3)Repeat-associated siRNAs(ra-siRNAs),24nt,參與染色體水平的基因沉默、抑制轉座子的轉座。
顯然,生命體內還存在許多具有重要功能的small RNAs。如何鑒定與發現這些RNA是值得人們思索的重要問題。
以往用于尋找miRNAs等小RNA的方法有實驗克隆法,計算機預測法。克隆法可以直接用于鑒定新小RNA,是初期發掘小RNA的常用方法,不足之處是實驗周期較長,對低表達的小RNA的發現能力十分有限。計算機預測法多是針對某一已知的小RNA特征設計算法,從全基因組或EST數據庫中快速發掘大量潛在的小RNA,一定程度上彌補了克隆法的缺點,然而,預測的小RNA最終還需要實驗證明,同時計算機預測法對新類型小RNA的發掘能力十分有限。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于重慶佰諾吉生物科技有限公司,未經重慶佰諾吉生物科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/201711439911.4/2.html,轉載請聲明來源鉆瓜專利網。
- 同類專利
- 專利分類
G06F 電數字數據處理
G06F19-00 專門適用于特定應用的數字計算或數據處理的設備或方法
G06F19-10 .生物信息學,即計算分子生物學中的遺傳或蛋白質相關的數據處理方法或系統
G06F19-12 ..用于系統生物學的建模或仿真,例如:概率模型或動態模型,遺傳基因管理網絡,蛋白質交互作用網絡或新陳代謝作用網絡
G06F19-14 ..用于發展或進化的,例如:進化的保存區域決定或進化樹結構
G06F19-16 ..用于分子結構的,例如:結構排序,結構或功能關系,蛋白質折疊,結構域拓撲,用結構數據的藥靶,涉及二維或三維結構的
G06F19-18 ..用于功能性基因組學或蛋白質組學的,例如:基因型–表型關聯,不均衡連接,種群遺傳學,結合位置鑒定,變異發生,基因型或染色體組的注釋,蛋白質相互作用或蛋白質核酸的相互作用





