[發明專利]一種轉錄本注釋方法以及篩選長非編碼RNA和內源逆轉錄病毒來源長非編碼RNA的方法在審
| 申請號: | 202011007988.6 | 申請日: | 2020-09-23 |
| 公開(公告)號: | CN112201307A | 公開(公告)日: | 2021-01-08 |
| 發明(設計)人: | 孔慶然;杜佳偉;侯衛博;丁春明 | 申請(專利權)人: | 溫州醫科大學 |
| 主分類號: | G16B25/10 | 分類號: | G16B25/10;G16B30/00;G16B35/20;G16B50/10;G16B50/30 |
| 代理公司: | 哈爾濱市陽光惠遠知識產權代理有限公司 23211 | 代理人: | 鄧宇 |
| 地址: | 325027 *** | 國省代碼: | 浙江;33 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 轉錄 注釋 方法 以及 篩選 編碼 rna 內源 逆轉錄 病毒 來源 | ||
1.一種轉錄本的注釋方法,其特征在于,所述的注釋方法的具體步驟包括:
(1)對RNA測序和小RNA測序的下機數據進行去接頭處理獲得有效數據;
(2)對步驟(1)中得到的有效數據按照質控標準進行數據質控,得到符合標準的有效數據;
(3)分別將步驟(2)中得到的符合標準的有效數據與參考基因組進行比對拼接,獲得對比結果文件;
(4)把步驟(3)中得到的對比結果文件,以MAPQs值作為篩選標準篩選轉錄本;
(5)將步驟(4)中得到的轉錄本進行定量分析,獲得定量結果文件,以Fpkm值作為篩選標準進行篩選,得到完整轉錄本。
2.根據權利要求1所述的注釋方法,其特征在于,步驟(1)中采用trim_galore或cutadapt軟件得到有效數據。
3.根據權利要求1所述的注釋方法,其特征在于,步驟(2)中所述的質控標準為:
(1)每一個堿基的測序質量得分不低于20;
(2)每一條序列的鳥嘌呤胞嘧啶含量符合正態分布,偏差不超過15%;
(3)測序結果中不確定堿基的含量不超過5%;
(4)每一個讀長的測序長度保持一致;
(5)序列的重復性不超過20%;
采用FastQC軟件分析得到符合標準的有效數據。
4.根據權利要求1所述的注釋方法,其特征在于,步驟(3)采用hisat2、bowtie2、tophat2或subjunc軟件分析得到對比結果文件。
5.根據權利要求1所述的注釋方法,其特征在于,步驟(4)中所述的篩選標準是MAPQs大于10。
6.根據權利要求1所述的注釋方法,其特征在于,步驟(5)中所述的篩選標準是Fpkm大于0.5。
7.一種篩選長非編碼RNA的方法,其特征在于,所述的方法中的轉錄本注釋方法采用的權利要求1-6任意一項所述的注釋方法。
8.根據權利要求7所述的方法,其特征在于,所述的方法中是采用CPC2和CNCI軟件分析所述的注釋方法得到的完整轉錄本,然后篩選得到長非編碼RNA。
9.一種篩選內源逆轉錄病毒來源長非編碼RNA的方法,其特征在于,所述的方法具體步驟包括:
(1)篩選長非編碼RNA:采用權利要求8所述的方法篩選編碼的長非編碼RNA;
(2)從步驟(1)得到的長非編碼RNA中,根據在染色體上的位置選擇與內源逆轉錄病毒距離5kb以內的長非編碼RNA,作為篩選得到內源逆轉錄病毒來源長非編碼RNA。
10.根據權利要求9所述的方法,其特征在于,步驟(2)中采用bedtools interact軟件篩選得到內源逆轉錄病毒來源長非編碼RNA。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于溫州醫科大學,未經溫州醫科大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202011007988.6/1.html,轉載請聲明來源鉆瓜專利網。





