[發明專利]一種三代全長轉錄組輔助基因預測的方法在審
| 申請號: | 202110322129.4 | 申請日: | 2021-03-25 |
| 公開(公告)號: | CN113077842A | 公開(公告)日: | 2021-07-06 |
| 發明(設計)人: | 鄭洪坤;劉福?;李緒明;李婧姬;王晶 | 申請(專利權)人: | 北京百邁客生物科技有限公司 |
| 主分類號: | G16B20/30 | 分類號: | G16B20/30;G16B30/10 |
| 代理公司: | 北京路浩知識產權代理有限公司 11002 | 代理人: | 錢云 |
| 地址: | 101300 北京市順義區南*** | 國省代碼: | 北京;11 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 全長 轉錄 輔助 基因 預測 方法 | ||
1.全基因組水平基因結構預測的方法,其特征在于,包括:
使用物種的二代測序數據和同源物種基因信息預測物種基因結構,獲取物種的二代測序數據和同源物種基因信息中內含子剪切位點信息的交集;
所述交集與物種三代全長轉錄組數據中的內含子剪切位點進行合并;
所述合并后的內含子剪切位點用于鑒定并糾正物種三代全長轉錄組數據預測基因結構得到的內含子剪切位點,獲取轉錄本。
2.根據權利要求1所述的方法,其特征在于,所述交集的獲取包括:
基于二代Illumina平臺得到的轉錄組數據預測所述物種基因結構和基于同源物種基因信息數據預測所述物種基因結構,獲取reads數大于2的內含子剪切位點,且確保內含子剪切位點位于內含子與位于外顯子的比值大于0.5。
3.根據權利要求1所述的方法,其特征在于,所述物種三代全長轉錄組數據中的內含子剪切位點的獲取包括:
基于三代Nanopore平臺得到的全長轉錄組數據預測物種基因結構,獲取所述三代全長轉錄組數據中所剪切內含子以GT開頭,AG結尾,或所剪切內含子以GC開頭,AG結尾;read數大于5的內含子剪切位點。
4.根據權利要求1所述的方法,其特征在于,所述轉錄本的獲取,包括:
所述合并后的內含子剪切位點左右延伸10-30個堿基,與物種三代全長轉錄組數據預測物種基因結構得到內含子剪切位點取交集,落在交集中的內含子剪切位點,用所述合并后的內含子剪切位點來替換。
5.根據權利要求1-4任一項所述的方法,其特征在于,所述轉錄本與所述物種的基因組信息進行比對后,采用genemaker-ST實現全基因組水平基因結構預測。
6.用于全基因組基因結構預測的三代全長轉錄本,其特征在于,使用權利要求1-5任一項所述方法獲取。
7.根據權利要求6所述的三代全長轉錄本,其特征在于,還包括,由PASA組裝非全長的轉錄本得到。
8.根據權利要求7所述的三代全長轉錄本,其特征在于,若所述三代全長轉錄本對應到基因組上的剪接位點相同,進行所述三代全長轉錄本的去冗余。
9.權利要求1-5任一項所述的方法或權利要求6-8任一項所述的三代全長轉錄本在可變剪接預測中的應用。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于北京百邁客生物科技有限公司,未經北京百邁客生物科技有限公司許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202110322129.4/1.html,轉載請聲明來源鉆瓜專利網。





