[發明專利]一種RNA序列中M5C位點的識別預測方法及系統在審
| 申請號: | 202010832292.0 | 申請日: | 2020-08-18 |
| 公開(公告)號: | CN111951889A | 公開(公告)日: | 2020-11-17 |
| 發明(設計)人: | 祝小雷;周巍巍;王紅;劉宇峰;陳瀟 | 申請(專利權)人: | 安徽農業大學 |
| 主分類號: | G16B20/30 | 分類號: | G16B20/30;G06N20/10;G06K9/62;G06Q10/04 |
| 代理公司: | 合肥昊晟德專利代理事務所(普通合伙) 34153 | 代理人: | 王林 |
| 地址: | 230000 *** | 國省代碼: | 安徽;34 |
| 權利要求書: | 查看更多 | 說明書: | 查看更多 |
| 摘要: | |||
| 搜索關鍵詞: | 一種 rna 序列 m5c 識別 預測 方法 系統 | ||
本發明公開了一種RNA序列中M5C位點的識別預測方法及系統,屬于M5C位點預測技術領域,包括以下步驟:S1:構建基準數據集;S2:利用特征表示RNA片段;S3:對特征進行優化選擇;S4:構建預測模型;S5:利用模型進行預測。本發明構建了一個平衡的數據集Mat372,在此數據集的基礎上,利用KNF、KSNPF和pseDNC三個特征對RNA片段進行編碼,對特征進行優化選擇后,利用SVM建立了M5C?NSGAII預測模型,能夠對RNA序列中的5?甲基胞嘧啶(M5C)位點進行準確識別,值得被推廣使用。
技術領域
本發明涉及M5C位點預測技術領域,具體涉及一種RNA序列中M5C位點的識別預測方法及系統。
背景技術
自然界中,DNA的轉錄后加工與修飾是一種常見的現象,RNA的代謝過程和功能受特定RNA序列基序、RNA形成二級結構并組裝成核糖核蛋白復合物的能力的影響。基于上述效應,記錄這些分子的轉錄后修飾過程和程度,如剪切輸出、免疫耐受等,具有重要意義。因此,人們越來越重視研究轉錄后修飾在RNA中的發生率和生物學相關性。5-甲基胞嘧啶(5-methylcytosine,M5C)是RNA中的一類高豐度的轉錄后修飾(PTCM),已經在多種生物中被發現。通過RNA甲基轉移酶的作用,RNA序列中的胞嘧啶的第5位碳原子發生修飾,被轉換成M5C。M5C在tRNA二級結構的穩定性、氨基酸酰化和密碼子識別、應激反應調控等生物學過程中發揮著重要的作用,從而得到了廣泛的研究。精確識別RNA序列中M5C位點,對于理解M5C的功能作用和機制具有重要意義和幫助。
一些實驗方法,比如亞硫酸氫鹽測序、M5C-rip、Aza-IP或miCLIP等已被開發用來識別M5C位點。亞硫酸氫鹽測序使用亞硫酸氫鹽來處理核酸序列,沒有甲基化的胞嘧啶會轉化為尿嘧啶,而甲基化的胞嘧啶不發生改變,可以由此識別位點。M5C-rip技術來源于RNA結合蛋白免疫沉淀(RNABindingProteinImmunoprecipitation),RNA BindingProteinImmunoprecipitation是研究細胞內RNA和蛋白結合情況的一種技術,是了解轉錄后調控網絡動態過程的強有力工具,并且可以幫助找到miRNA的調節靶點。RIP是一種新興的技術,運用針對目標蛋白的抗體沉淀出相應的RNA-蛋白復合物,然后經過分離純化,結合在復合物上的RNA就可以被分析。RIP可以被視為一個類似普遍使用的染色質免疫沉淀ChIP技術的應用,但由于研究對象是RNA-蛋白復合物而不是DNA-蛋白復合物,RIP的優化條件實驗不同于ChIP實驗(如復合物不需要固定,RIP反應體系中的試劑和抗體必須不包含RNA酶,抗體需要通過RIP實驗進行驗證等等)。通過將PCR產物克隆成載體并加以測序,可以提升測序的成功概率,這種方法稱為BSP-克隆測序法。miCLIP可以交聯RNA-m6A抗體結合位點,當抗體結合的RNA被逆轉錄時,這些特異性位點會發生突變。這種獨有的突變特征(例如,C-T轉換或截短)的測序可以精確定位m6a,然后在此基礎上發展一個可定位M5C的方法。然而,這些技術既費時又昂貴,此外,測序技術的快速發展導致RNA序列的爆炸性增長,這就需要更快、更經濟的分析方法。
該專利技術資料僅供研究查看技術是否侵權等信息,商用須獲得專利權人授權。該專利全部權利屬于安徽農業大學,未經安徽農業大學許可,擅自商用是侵權行為。如果您想購買此專利、獲得商業授權和技術合作,請聯系【客服】
本文鏈接:http://www.szxzyx.cn/pat/books/202010832292.0/2.html,轉載請聲明來源鉆瓜專利網。





